Inteligența artificială a depășit medicii în stabilirea diagnosticului la urgențe - test major din lumea reală

Inteligența artificială a depășit medicii în stabilirea diagnosticului la urgențe - test major din lumea reală
Sprijină jurnalismul independent
Donează acum

Inteligența artificială începe să depășească medicii în stabilirea diagnosticului corect, iar viziunea unei îngrijiri medicale de urgență asistate de AI ar putea deveni curând realitate.

Într-un nou studiu, cercetătorii arată că un tip de AI cunoscut sub numele de model lingvistic de mari dimensiuni (LLM) a depășit adesea medicii de la urgențe în diagnosticarea unor afecțiuni complexe și potențial letale, inclusiv reducerea fluxului de sânge către inimă, chiar și în cazurile aflate în prima fază a îngrjirii, când informațiile sunt limitate, potrivit unui raport publicat în revista Science.

În această fază, modelul a identificat diagnosticul corect sau unul foarte apropiat în aproximativ 67% dintre cazuri, comparativ cu circa 50%–55% în cazul medicilor. Iar tehnologia continuă să se îmbunătățească, notează Science.

ADVERTISING

Echipa din spatele noului studiu a testat cât de precis poate un LLM avansat, modelul o1 dezvoltat de OpenAI, să diagnosticheze pacienți cu diverse afecțiuni. Cinci dintre sarcini au cerut modelului să analizeze profiluri medicale selectate manual și să propună un diagnostic, să aleagă pașii următori sau să estimeze probabilitatea unei schimbări specifice în starea viitoare de sănătate.

În toate cele cinci exerciții, o1 a avut performanțe similare sau superioare medicilor. Diferența dintre model și oameni a fost atât de consistentă încât autorii s-au temut că rezultatele nu vor fi crezute, spune Adam Rodman, coautor al lucrării și medic internist la Beth Israel Deaconess Medical Center.

ADVERTISING

Într-una dintre sarcini, o1 a obținut un scor perfect de raționament clinic – bazat pe modul în care explica diagnosticul și pașii următori – în 98% dintre cazuri, în timp ce medicii au reușit acest lucru doar în 35% dintre situații.

Testul final pentru o1, considerat „cel mai important” de Thomas Buckley, coautor și informatician la Harvard University, a presupus diagnosticarea pacienților din urgență în trei etape diferite ale îngrijirii. Când un pacient ajunge la urgență, acesta își descrie mai întâi simptomele unei asistente de triaj, apoi este evaluat de un medic, iar în final se stabilește planul de tratament.

ADVERTISING

Fiecare etapă este predispusă la erori, deoarece pacienții pot avea dificultăți în a-și explica simptomele, iar medicii gestionează adesea mai multe cazuri stresante simultan. Deciziile timpurii de triaj sunt deosebit de dificile, deoarece trebuie luate rapid, iar greșelile pot avea consecințe imediate. De exemplu, un medic care confundă o infecție a sângelui cu o răceală obișnuită ar putea trimite pacientul acasă fără antibiotice, o decizie potențial fatală.

Cercetătorii au folosit cazuri reale de pacienți care au ajuns la urgență la Beth Israel și au furnizat informațiile modelului o1 treptat, imitând cele trei etape ale îngrijirii. Spre deosebire de celelalte experimente, acesta a testat direct modul în care LLM-ul gestionează date din „lumea reală”, care pot fi incomplete sau părtinitoare, notează Buckley.

În faza inițială a îngrijirii, când pacientul oferă informații limitate, o1 a identificat diagnosticul exact sau unul apropiat în 67% dintre cazuri, cu peste 10% mai mult decât doi medici care au primit aceleași cazuri. Deși diferența s-a redus pe măsură ce au fost disponibile mai multe informații, modelul a continuat să depășească medicii cu 2% până la 10% în etapele ulterioare.

Modelul o1 al OpenAI a fost lansat la sfârșitul anului 2024 și este posibil ca modelele mai noi să aibă rezultate chiar mai bune.

În continuare, Rodman și echipa sa desfășoară noi experimente în care modelul analizează pacienți folosind informații mai extinse și pe termen mai lung din lumea reală, obiectivul fiind acela de a vedea dacă aceste sisteme pot îmbunătăți efectiv îngrijirea pacienților în afara testelor controlate.

C.S.