
"Inception" 50 milyon dollar cəlb etdi: Kod və Mətn üçün Yüksək Sürətli Diffuziya Sİ Modelləri Hazırlanır

Süni İntellekt (Sİ) startaplarına böyük həcmdə maliyyə axınının olduğu bir dövrdə, "Inception" adlı şirkət kod və mətn üçün diffuziya əsaslı Sİ modelləri hazırlamaq məqsədilə 50 milyon dollarlıq toxum sərmayəsi cəlb edib. Bu investisiya, "Menlo Ventures"-in rəhbərliyi ilə baş tutub, sənayenin tanınmış mütəxəssisləri Andrew Ng və Andrej Karpathy də layihəyə angel sərmayəsi ilə dəstək veriblər. Bu vəsaitlər "Inception"-a öz Sİ ideyasını böyük laboratoriyalardan kənarda, müstəqil bir şirkət olaraq sürətlə inkişaf etdirməyə kömək edəcək. Şirkətin əsas məqsədi, mövcud Sİ həllərinə nisbətən daha səmərəli və sürətli işləyə bilən yeni nəsil modellər yaratmaqdır.
Layihənin lideri Stanford professoru Stefano Ermondur. Onun tədqiqatları, söz-bəsöz deyil, təkrarlanan təmizlənmə yolu ilə nəticələr yaradan diffuziya modellərinə yönəlib. Bu yanaşma artıq Stable Diffusion, Midjourney və Sora kimi məşhur şəkil yaradan Sİ sistemlərini gücləndirir. Ermon, bu sistemlər üzərində Sİ partlayışından əvvəl işləməyə başlayıb və indi bu modelləri daha geniş sahələrə, xüsusən də proqram təminatı inkişafına tətbiq edir. Şirkət sərmayə xəbəri ilə birlikdə, proqram təminatının yaradılması üçün nəzərdə tutulmuş "Mercury" modelinin yeni versiyasını təqdim etdi. Bu model artıq ProxyAI, Buildglare və Kilo Code daxil olmaqla bir çox inkişaf alətinə inteqrasiya edilib.
Ermon bildirir ki, diffuziya yanaşması "Inception" modellərinə iki mühüm göstəriciyə - cavabvermə sürətinə (latency) və hesablama xərclərinə qənaət etməyə imkan verir. O deyir ki, diffuziya əsaslı böyük dil modelləri (LLM) hazırda hər kəsin qurduğu modellərdən çox daha sürətli və səmərəlidir, çünki bu, hələ də çox yenilik gətirilə biləcək tamamilə fərqli bir yanaşmadır. Əksər mətn əsaslı Sİ xidmətlərinə hakim olan avtoreqressiya modelləri (məsələn, GPT-5 və Gemini) ardıcıl işləyərək, əvvəlki materiala əsaslanaraq növbəti sözü proqnozlaşdırır. Ancaq diffuziya modelləri daha bütöv bir yanaşma tətbiq edir, cavabın ümumi quruluşunu istənilən nəticəyə uyğun gələnə qədər addım-addım dəyişir.
Diffuziya modellərinin mətni böyük həcmdə emal edərkən və ya məlumat məhdudiyyətləri ilə işləyərkən daha yaxşı nəticələr göstərə biləcəyinə dair artan araşdırmalar mövcuddur. Ermonun dediyinə görə, bu xüsusiyyətlər böyük kod bazaları üzərində əməliyyatlar apararkən əsl üstünlüyə çevrilir. Başqa bir vacib cəhət, diffuziya modellərinin aparat təminatından daha çevik istifadə etməsi ilə bağlıdır. Avtoreqressiya modelləri əməliyyatları bir-birinin ardınca icra etməli olduğu halda, diffuziya modelləri eyni anda çoxsaylı əməliyyatı paralel şəkildə yerinə yetirə bilir. Bu da mürəkkəb tapşırıqlarda cavabvermə sürətinin əhəmiyyətli dərəcədə aşağı düşməsinə səbəb olur. Ermon vurğulayıb ki, onların sistemi saniyədə 1000-dən çox token sürəti ilə sınaqdan keçirilib. Bu, mövcud avtoreqressiya texnologiyalarının bacardığından qat-qat yüksəkdir, çünki onların yanaşması əvvəldən paralel işləməyə və yüksək sürətə hesablanıb.
Oyun sənayesi və virtual reallıq texnologiyaları haqqında yazıram. Gaming mədəniyyətinin Azərbaycanda inkişafını izləmək maraq doğurur.
Bütün məqalələrə baxınEtiketlər
Oxşar xəbərlər

Azərbaycanın ən çox investisiya qoyduğu ölkələr aç...
Bugun.az

Süni İntellekt Startapı Fal.ai 4 Milyard Dollardan...
Texnologiya xəbərləri

Yannik Sinner karyerası boyu 50 milyon dollar qaza...
Azəri Xəbər

Strive Üstünlük Verilən Səhm Təklifinin Həcmini Ar...
Kripto

Bitcoin 106 Min Dollarlıq Eniş Yaşadı: Kripto Baza...
Kripto

Ermənistanda müdafiə ehtiyaclarına əlavə 11 milyon...
Azəri Xəbər


