5 previziuni de la MIT Technology Review: Ce urmează pentru Ai în 2025

5 previziuni de la MIT Technology Review: Ce urmează pentru Ai în 2025
Sprijină jurnalismul independent
Donează acum

Jocuri video generate de AI pentru divertisment sau antrenarea roboților, modele de limbaj (precum ChatGPT, spre exemplu) antrenate să își construiască răspunsurile pas cu pas, descompunând problemele dificile în serii de pași mai simpli, aplicații AI în știință, dar și în domeniul militar, precum și o mai mare concurență pentru Nvidia, se numără printre previziunile MIT Technology Review pentru AI în 2025.

Locuri de joacă virtuale generative

Dacă 2023 a fost anul imaginilor generative, iar 2024 cel al videoclipurilor generative, ce urmează? În opinia specialiștilor, lumi virtuale generative (a.k.a. jocuri video).

În februarie 2024, Google DeepMind a dezvăluit un model generativ numit Genie, capabil să transforme o imagine statică într-un joc 2D tip platformă, cu care utilizatorii pot interacționa. În decembrie, compania a prezentat Genie 2, un model care poate transforma o imagine inițială într-o lume virtuală întreagă.

ADVERTISING

Alte companii dezvoltă tehnologii similare. În octombrie, startup-urile Decart și Etched au prezentat un hack neoficial pentru Minecraft, în care fiecare cadru al jocului este generat în timp real pe măsură ce jucați. World Labs, un startup cofondat de Fei-Fei Li—creatoarea ImageNet, setul masiv de date foto care a declanșat boom-ul deep-learning-ului—lucrează la așa-numitele modele mari de lume (LWM).

O aplicație evidentă este pentru jocuri video. Experimentele inițiale au o notă jucăușă, iar simulările 3D generative ar putea fi utilizate pentru a explora concepte de design pentru jocuri noi, transformând rapid o schiță într-un mediu de joc. Acest lucru ar putea duce la apariția unor tipuri complet noi de jocuri.

Totuși, ele ar putea fi folosite și pentru a antrena roboți, mai punctează MIT. World Labs își propune să dezvolte așa-numita inteligență spațială—capacitatea mașinilor de a interpreta și interacționa cu lumea de zi cu zi.

ADVERTISING

Cercetătorii în robotică nu dispun de suficiente date despre scenarii din lumea reală pentru a antrena astfel de tehnologii. Generarea unui număr nelimitat de lumi virtuale și plasarea roboților virtuali în acestea pentru a învăța prin încercare și eroare ar putea rezolva această problemă.

Modele mari de limbaj care „raționează”

Când OpenAI a prezentat o1 în septembrie, a introdus un nou mod de funcționare a modelelor mari de limbaj. Două luni mai târziu, compania a îmbunătățit acest model sub toate aspectele cu o3—un model care ar putea schimba radical această tehnologie.

Majoritatea modelelor, inclusiv GPT-4, oferă primul răspuns pe care îl generează. Uneori e corect, alteori nu. Noile modele sunt însă antrenate să își construiască răspunsurile pas cu pas, descompunând problemele dificile în serii de pași mai simpli. Când o abordare nu funcționează, încearcă alta. Această tehnică, cunoscută sub numele de „raționament”, poate face tehnologia mai precisă, în special pentru probleme de matematică, fizică și logică.

ADVERTISING

Este, de asemenea, esențial pentru agenți (sisteme automate care pot efectua sarcini complexe în mod autonom sau semi-autonom, folosind modele avansate de limbaj și alte tehnologii IA. Aceștia sunt programe capabile să interacționeze cu oameni, alte sisteme software sau lumea fizică, pentru a îndeplini un scop specific. Agenții de IA sunt deseori integrați în aplicații care combină mai multe surse de date și capabilități tehnologice).

În decembrie, Google DeepMind a dezvăluit un nou agent experimental pentru navigarea pe web, numit Mariner. În timpul unei demonstrații oferite revistei MIT Technology Review, Mariner părea că s-a blocat. Megha Goel, manager de produs la companie, i-a cerut agentului să găsească o rețetă de fursecuri de Crăciun care să semene cu cele dintr-o fotografie pe care i-o oferise. Mariner a găsit o rețetă online și a început să adauge ingredientele în coșul de cumpărături al lui Goel.

Apoi s-a oprit: nu reușea să determine ce tip de făină să aleagă. Goel a privit cum Mariner și-a explicat pașii într-o fereastră de chat: „Spune: ‘Voi folosi butonul Înapoi al browserului pentru a reveni la rețetă.’”

A fost un moment remarcabil. În loc să se împotmolească, agentul a împărțit sarcina în acțiuni separate și a ales una care ar putea rezolva problema. Să-ți dai seama că trebuie să apeși butonul Înapoi poate părea un lucru banal, dar pentru un bot lipsit de inteligență, e remarcabil. Și a funcționat: Mariner s-a întors la rețetă, a confirmat tipul de făină și a continuat să completeze coșul de cumpărături.

Google DeepMind lucrează, de asemenea, la o versiune experimentală a modelului său de limbaj avansat, Gemini 2.0, care folosește această abordare pas cu pas pentru rezolvarea problemelor, numită Gemini 2.0 Flash Thinking.

Dar OpenAI și Google sunt doar vârful aisbergului. Multe companii dezvoltă modele mari de limbaj care utilizează tehnici similare, făcându-le mai eficiente într-o gamă largă de sarcini, de la gătit la programare.

Citeşte informaţiile integral in articolul MIT Technology Review: Ce urmează pentru inteligența artificială (IA) în 2025/ 5 previziuni publicat de Curs de Guvernare


În fiecare zi scriem pentru tine. Dacă te simți informat corect și ești mulțumit, dă-ne un like. 👇