OpenAI a dezvăluit GPT-4o, o versiune îmbunătățită cu timp de răspuns mai rapid și o nouă tehnologie vocală. GPT-4o oferă răspunsuri text-to-speech în timp real, având capacitatea de a ajusta tonurile vocale emoționale. Contrar modelelor anterioare, GPT-4o este disponibil gratuit pentru toți utilizatorii, iar cei care plătesc beneficiază de o capacitate superioară.
Prezentarea actualizării de primăvară a OpenAI a fost transmisă în direct pe YouTube. CEO-ul a menționat că acest moment era unul pe care „îl visase”, fără a oferi detalii precise. Totuși, compania a dezvăluit în cele din urmă „GPT-4o”, subliniind importanța faptului că este gratuit pentru toți utilizatori.
Conform afirmațiilor companiei, GPT-4o va funcționa similar cu predecesorul său, GPT-4, însă va avea o viteză de lucru mai mare. De asemenea, introduce o nouă tehnologie în tehnologia vocală, care permite utilizatorilor să interacționeze cu ChatGPT folosind microfonul lor.
Scopul OpenAI este să ofere o experiență de conversație cu ChatGPT similară cu cea cu un om real, eliminând întârzierile care afectau imersiunea. Pentru asta, compania adaugă noi tehnologii în spatele lui GPT-4o pentru a îmbunătăți rapiditatea conversației cu acest chatbot.
Demonstrația realizată de OpenAI a evidențiat abilitățile lui GPT-4o de a interacționa vocal. Nu doar că GPT-4o a răspuns aproape instantaneu, dar a și răspuns cu text-to-speech, creând impresia că interlocutorul dialoghează cu o persoană reală. În timpul demonstrației, GPT-4o a oferit chiar și sfaturi referitoare la respirație, captând și analizând mostre audio ale respirației pentru a îmbunătăți această abilitate.
Într-o altă demonstrație, GPT-4o a creat o poveste pornind de la promptul „roboți și dragoste”. În timpul narării, prezentatorul a intervenit cerând ajustarea emoțională a vocii lui GPT-4o. Demonstrația a evidențiat capacitatea lui GPT-4o de a-și modifica vocea în funcție de cerințe, de la o interpretare dramatică la una mai rece și mai robotică. De asemenea, s-au evidențiat abilitățile sale de a cânta, completând astfel povestea.
GPT-4o a demonstrat și capacități pedagogice într-o altă situație, ghidând utilizatorii în rezolvarea unei ecuații matematice. În plus, a răspuns la întrebarea comună „Când voi folosi asta în viața reală?”, oferind exemple practice despre importanța ecuațiilor pătratice în sarcinile cotidiene.
Utilizând versiunea desktop a lui GPT-4o, demonstratorii au analizat un cod și au primit explicații clare despre funcționarea acestuia, precum și despre posibile modificări. De asemenea, s-a demonstrat capacitatea lui GPT-4o de a traduce în timp real între două limbi străine, facilitând astfel comunicarea între vorbitori de limbi diferite.
De obicei, noile versiuni ale modelului ChatGPT al OpenAI sunt disponibile doar pentru utilizatorii care plătesc. Cu toate acestea, compania a decis să ofere această nouă tehnologie tuturor utilizatorilor, deși cei care plătesc vor beneficia de o capacitate de utilizare de cinci ori mai mare. Implementarea noilor update-uri va avea loc în următoarele săptămâni.