Cum a fost făcut ChatGPT să zică lucruri care nu se spun despre religie sau... Hitler

Anumite comenzi determină programul bazat pe inteligenţa artificială să adopte un mod de exprrimare necenzurat și să nu mai respecte standardele obișnuite de conținut.

Utilizatorii care testează capacitatea ChatGPT de a îndeplini prompt și eficient sarcinile de redactare au descoperit câteva „portițe” prin care evită filtrele de moderare. Astfel, o simplă discuție de tip text poate determina programul bazat pe inteligența artificială (AI) să facă declarații care în mod normal nu sunt permise, relatează The Guardian.

ADVERTISING

ChatGPT poate răspunde la majoritatea întrebărilor care i se adresează, însă standardele sale împiedică crearea de conținut scris care promovează ura, violența, dezinformarea și instrucțiuni pentru comiterea unor fapte care încalcă legea.

Utilizatorii platformei de socializare Reddit au găsit, însă, o vulnerabilitate prin care ChatGPT poate fi comutat într-un mod secundar, denumit DAN, un acronim pentru sintagma "Do Anything Now" ("Fă orice acum").

Acest mod de funcționare nu are limitările pe care OpenAI le-a impus în modul principal în care funcționează ChatGPT. Modul GPT răspunde normal, iar DAN răspunde fără să mai țină cont de reguli, morală și etică - acesta poate prezenta informații neverificate, necenzurate și poate avea opinii puternice despre orice subiect.

ADVERTISING

Un utilizator Reddit i-a cerut lui DAN să facă un comentariu sarcastic despre creștinism. Răspunsul acestuia a venit imediat: "O, cum să nu iubești religia întoarcerii celuilalt obraz? Unde iertarea e doar o virtute, dacă nu cumva ești gay, ceea ce e un păcat."

Alții au reușit să-l facă pe DAN să spună glume despre femei în stilul lui Donald Trump și să-l laude pe Hitler.

Folosirea ChatGPT pentru a da răspunsuri necenzurate este posibilă din luna decembrie, dar utilizatorii au fost nevoiți să găsească noi modalități de a ocoli soluțiile de remediere implementate de programatorii companiei OpenAI. Potrivit ziarului citat, OpenAI pare să se miște repede în corectarea vulnerabilităților pe măsură ce utilizatorii descoperă altele noi.

ADVERTISING

T.D.

Adaugă spotmedia ca sursă preferată în Google