MIT-IBM Tələbələrinin Araşdırmaları: Süni İntellekt (Sİ) Necə Daha Etibarlı və Sürətli Olur?

06.11.2025 21:48 5 baxış sayı 6 dəq. oxuma MIT AI News
MIT-IBM Tələbələrinin Araşdırmaları: Süni İntellekt (Sİ) Necə Daha Etibarlı və Sürətli Olur?

Yeni alət və texnologiyalar o zaman geniş yayılır ki, istifadəçilər onları etibarlı, əlçatan hesab edir və mövcud iş metodlarından daha yaxşı görürlər. MIT-IBM Watson Süni İntellekt Laboratoriyasının Yay Proqramının ilk məzunlarından olan beş doktorant, ən son resurslardan istifadə edərək, Sİ-dəki çətinlikləri aradan qaldırır və onun faydalılığını artırmaq üçün yeni funksiyalar yaradırlar. Onların işləri modelin dəqiqliyinə nə vaxt güvənməkdən, bilik bazaları üzərində daha səmərəli düşünməyə qədər geniş sahələri əhatə edir. Tələbələrin və mentorların birgə səyləri o istiqamətə yönəlib ki, praktik və texniki cəhətdən sərt araşdırmalar nəticəsində müxtəlif sahələrdə daha inanclı və dəyərli Sİ modelləri ortaya çıxsın.


MIT-dən riyaziyyat üzrə doktorant Andrey Bryutkinin araşdırması modellərin etibarlılığını ön planda tutur. O, LLM-lərin (Böyük Öyrənmə Modelləri) daxili davranışlarını anlamaq üçün bir metod hazırlayıb. Ənənəvi olaraq, inkişaf etdiricilər "zondlar" adlanan kiçik sinir şəbəkələrindən istifadə edərək etibarsız cavabları aşkar edirlər. Lakin bu zondlar da səhvlər buraxa bilər və nə zaman LLM-in uğursuzluğa düçar olduğunu göstərmir. Bryutkinin komandası zondun nə qədər etibarlı olduğunu müəyyən etmək üçün LLM-dən gələn gizli vəziyyətlərdən və aktivasiya vektorlarından istifadə edərək, proqnozlaşdırılması çətin olan məlumat sahələrini öyrənir. Bu funksiya, xüsusən də tibb kimi həyati sahələrdə, Sİ sistemlərinin tam etibarlılığı üçün vacib olan etiketlənmiş məlumatların keyfiyyətini təyin etməyə kömək edir.


Başqa bir tələbə, fizika üzrə Jinyeop Sonq, LLM-lərin "uydurmalarını" (hallüsinasiyalarını) aradan qaldırmağa çalışır. O, LLM-ləri xarici, etibarlı bilik bazaları (KGs - Knowledge Graphs) ilə birləşdirməyi təklif edir. Ənənəvi çoxagentli sistemlər çoxlu hesablama tələb etdiyi halda, Sonq bu prosesi sürətləndirən tək-agentli, çoxdövrlü gücləndirici öyrənmə çərçivəsi yaratdı. Bu çərçivədə, LLM agenti Freebase və Wikidata kimi KGs-dən məqsədli məlumatları alır və bu məlumatları kontekstə əlavə edərək sorğuya cavab verir. Sistem cavabın həm dəqiq, həm də tam olmasını təmin etmək üçün özünü öyrədir. Bu yanaşma əsaslandırılmış düşünmə prosesini təşkil etməyə imkan verir, nəticədə daha yüksək dəqiqlik, şəffaflıq və səmərəlilik əldə olunur.


Model cavabının vaxtında və tam olması onun dəqiqliyi qədər əhəmiyyətlidir. EECS-dən doktorant Sonqlin Yanq LLM-lərdəki transformer arxitekturasının məhdudiyyətlərini dəyişdirmək üzərində işləyir. Transformerlərin əsas problemi ondan ibarətdir ki, softmax diqqət mexanizmi səbəbindən uzun ardıcıllıqları modelləşdirərkən hesablama xərci kəskin artır (giriş uzunluğu ikiqat artanda xərc dörd dəfə artır). Həmçinin, RoPE (fırlanan mövqeli kodlaşdırma) daxili vəziyyət dəyişikliklərini (məsələn, dəyişən dəyərləri) yaxşı tuta bilmir.


Bu problemləri həll etmək üçün MIT-IBM komandası kvadratik mürəkkəbliyi azaltmaq məqsədilə softmax diqqəti əvəzinə xətti diqqət mexanizmindən istifadə etdi. Onlar həmçinin daha zəngin ardıcıl məlumat başa düşülməsini təmin edən, lakin sürətli hesablama qabiliyyətini qoruyan, Householder çevrilməsinə əsaslanan dinamik əks etdirici mövqeli kodlaşdırma tətbiq etdilər. Bu inkişaf sayəsində transformerlər mürəkkəb alt problemləri daha az addımda və daha az hesablama tokeni ilə həll edə bilirlər.


Vizual məlumatlar insan beyninin tez şərh edə biləcəyi çoxsaylı detalları ehtiva edir. İki doktorant bu bacarığı kod vasitəsilə mənimsəməyin yollarını axtarır. Jovana Kondic diaqramların və qrafiklərin vizual sənəd başa düşülməsini araşdırdı. Onun qrupu təlim və müqayisə üçün böyük, açıq mənbəli, sintetik qrafik məlumat bazası olan ChartGen-i yaratdı. ChartGen bir VLM-dən istifadə edərək qrafiki oxuyur, onu yaratmış Python kodunu çıxarır və sonra bu kodu təkmilləşdirir. Nəticədə, 200,000-dən çox unikal qrafik-kod cütü əldə edildi. Digər tələbə, Leonardo Hernandez Cano, rəqəmsal dizaynda vizual tekstura yaradılmasına diqqət yetirdi. O, istifadəçi tərəfindən verilən tekstura təsvirindən başlayaraq ilkin Python proqramı yaradan və sonra kodu iterativ şəkildə təkmilləşdirən proqram sintezi sistemi hazırladı. Bu sistem rəqəmsal mühitdə real materialları (parlaqlıq, rəng və s.) təqlid edən vizuallaşdırmalar yarada bilir.


Bu layihələr və onların arxasında duran insanlar birlikdə daha praktik süni intellektə doğru mütəşəkkil bir təkan verir. Etibarlılıq, səmərəlilik və multimodal əsaslandırma kimi əsas problemləri həll etməklə, bu işlər Sİ sistemlərinin sadəcə daha güclü deyil, həm də real dünya sənaye və elmi tətbiqləri üçün daha etibarlı və xərc cəhətdən sərfəli olmasına zəmin yaradır.


N
Sosial media redaktoru

Sosial media və rəqəmsal trendlər haqqında yazıram. Platformaların alqoritmləri necə dəyişir və bu bizə necə təsir edir - mənim əsas mövzularım.

Bütün məqalələrə baxın
Paylaş: