AI deschide seifurile trecutului: manuscrise secrete, coduri pierdute și istorii care pot fi rescrise

AI deschide seifurile trecutului: manuscrise secrete, coduri pierdute și istorii care pot fi rescrise
Sprijină jurnalismul independent
Donează acum
Adaugă spotmedia ca sursă preferată în Google

Mesaje, manuscrise și documente istorice ascunse în spatele unor cifruri aproape imposibil de înțeles se găsesc în biblioteci și arhive din întreaga lume. Unele păstrează secrete diplomatice, ritualuri ale societăților secrete, rețete medicale, povești de dragoste sau detalii personale pe care autorii au vrut să le țină departe de ochii altora. Acum, inteligența artificială începe să-i ajute pe istorici și criptologi să deschidă aceste capsule ale trecutului.

Un exemplu spectaculos, relatează BBC, este așa-numitul cifru Borg, un manuscris aflat în arhivele Bibliotecii Vaticanului. Cartea, scrisă de mână și rămasă necitită mai bine de 400 de ani, are 408 pagini acoperite cu simboluri ciudate. Pe copertă există o notă care sugerează că textul ar conține remedii secrete „pentru afecțiuni ale corpului uman”. În epocă, astfel de practici puteau atrage suspiciuni sau chiar acuzații de vrăjitorie.

Manuscrisul este scris în mare parte într-un cod format din 34 de simboluri obscure, câteva litere romane și o pagină de început în arabă. Nu exista nicio cheie cunoscută pentru descifrarea textului, iar unele pagini sunt deteriorate de trecerea timpului, ceea ce a făcut sarcina și mai dificilă.

ADVERTISING

Cu ajutorul machine learning, o formă de inteligență artificială, cercetătorii au reușit însă să spargă codul. Au descoperit că manuscrisul conținea mii de remedii neobișnuite, inclusiv recomandări precum consumul mai multor pahare de vin roșu de bună calitate sau fermentarea nucșoarei în aluat pentru combaterea dizenteriei.

„Este ca o muncă de detectiv, în care fiecare simbol, tipar și soluție parțială ne poate aduce mai aproape de secretele cuiva și de o lume istorică pierdută”, a explicat pentru BBC Beáta Megyesi, profesor la Universitatea Stockholm, care a făcut parte din echipa care a descifrat textul.

Chiar și cu ajutorul AI, procesul a fost migălos. Cercetătorii vor însă să folosească aceste tehnologii pentru a descifra mai eficient alte texte istorice codificate, inclusiv documente considerate până acum imposibil de citit.

Potrivit unor estimări citate de BBC, aproximativ 1% din materialele păstrate în arhivele și bibliotecile lumii sunt complet sau parțial criptate. Unele dintre cele mai vechi cifruri cunoscute datează din Grecia și Roma antică.

Documentele codificate pot schimba uneori felul în care înțelegem o persoană sau o epocă. BBC amintește cazul unor scrisori codificate ale Mariei Stuart, regina Scoției, descifrate recent, care au arătat implicarea ei în planuri de recâștigare a tronului și relația tensionată cu fiul ei, Iacob al VI-lea al Scoției, devenit ulterior Iacob I al Angliei.

ADVERTISING

Unele cifruri istorice sunt relativ simple. Cifrul Borg, de exemplu, folosea o substituție simplă: fiecare simbol înlocuia o literă romană. Altele sunt mult mai greu de spart. Uneori, cercetătorii nu știu nici măcar limba în care a fost scris textul original. Alteori, autorii introduc simboluri fără sens pentru a-i deruta pe eventualii cititori, sau folosesc mai multe semne pentru aceeași literă.

Descifrarea poate cere luni de muncă. Cecile Pierrot, criptolog la Institutul Național Francez pentru Cercetare în Informatică și Automatizare, și colegii săi au avut nevoie de șase luni pentru a descifra treptat cheia unei scrisori vechi de 500 de ani a lui Carol Quintul, împărat al Sfântului Imperiu Roman și rege al Spaniei. Scrisoarea, scrisă cu 120 de simboluri diferite pe doar trei pagini, a arătat că unul dintre cei mai puternici oameni ai epocii era îngrozit de un posibil complot de asasinare.

Înainte ca un cod să poată fi spart, manuscrisul trebuie transformat într-un document digital. Această etapă este, în sine, dificilă: scrisul de mână este uneori dezordonat, cerneala s-a șters, iar simbolurile pot fi complet necunoscute. Pierrot spune că poate avea nevoie de o zi întreagă doar pentru a transcrie o scrisoare de două pagini cu simboluri pe care nu le cunoaște.

ADVERTISING

Aici intervine una dintre cele mai utile aplicații ale inteligenței artificiale. Michelle Waldispühl, profesor de lingvistică germană la Universitatea din Oslo, și colegii săi au folosit platforma AI Transkribus pentru a transcrie o scrisoare secretă trimisă în 1637 de nobilul Sigismund Heusner von Wandersleben cancelarului suedez Axel Oxenstierna, în timpul Războiului de 30 de Ani.

Instrumentul este antrenat pe mai multe limbi, tipuri de scriere și stiluri de mână din perioade istorice diferite. După încărcarea imaginii unui document, AI identifică blocurile de text și rândurile, apoi scanează caracter cu caracter pentru a transforma manuscrisul într-un text digital.

În cazul scrisorii lui Von Wandersleben, instrumentul a funcționat destul de bine, pentru că textul era doar parțial criptat, cu numere separate prin puncte și scrise clar. Alte pasaje erau în germană din secolul al XVII-lea.

Totuși, platformele existente se descurcă mai greu atunci când manuscrisele sunt criptate cu simboluri neobișnuite, semne inventate, simboluri astrologice sau cifre scrise atipic. De aceea, Megyesi, Waldispühl și alți cercetători lucrează, în cadrul proiectului internațional Descrypt, la un instrument AI specializat pentru transformarea textelor istorice scrise cu simboluri obscure în documente digitale care pot fi analizate de computer.

După transcriere începe adevărata muncă de detectiv. Criptologii folosesc, de regulă, programe specializate care încearcă să determine ce tip de cifru a fost folosit. În cazul codurilor simple, analiza frecvenței simbolurilor poate ajuta la identificarea literelor. De exemplu, în engleză, litera E apare cel mai des, iar Z, Q și X printre cele mai rar întâlnite.

Dar lucrurile se complică atunci când același sunet sau aceeași literă este reprezentată de mai multe simboluri. În scrisoarea lui Von Wandersleben, litera E era redată prin până la opt simboluri diferite, astfel că a fost nevoie de încercări repetate, verificări umane și cunoașterea germanei vechi pentru a descifra textul.

„A fost un du-te-vino constant între mașină și validatorul uman”, a explicat Waldispühl pentru BBC. Ea crede că, într-o zi, AI ar putea ajunge să facă singură acest proces, dar deocamdată expertiza umană rămâne esențială.

În spatele cifrului, cercetătorii au găsit avertismentele lui Von Wandersleben despre amenințările venite din partea unor facțiuni ale aliaților protestanți ai Suediei în Războiul de 30 de Ani. El îi relata cancelarului suedez că fusese nevoit să se retragă strategic după ce aflase despre o conspirație între aliați.

Cercetătorii încearcă acum să meargă și mai departe: să creeze sisteme AI care să poată analiza direct fotografii ale paginilor și să descifreze mesajele fără o etapă separată de transcriere. Megyesi și echipa ei au testat această abordare pe un manuscris de 105 pagini deja descifrat, cunoscut drept cifrul Copiale, care descrie ritualurile și regulile unei societăți secrete germane din secolul al XVIII-lea. După antrenarea sistemului pe mostre de scris și pe fragmente deja decodificate, AI a reușit să descifreze corect părți din text pe care nu le mai văzuse.

O astfel de tehnologie ar fi utilă mai ales atunci când limba originală a unui cifru este necunoscută. „Aceasta deschide posibilități interesante pentru sisteme de scriere rare și non-standard”, spune Megyesi. Obiectivul final este combinarea transcrierii și descifrării într-un singur pas.

Pentru a antrena astfel de instrumente, cercetătorii din proiectul Descrypt caută în arhive manuscrise codificate și construiesc o bază de date. Este o provocare majoră: modelele mari de limbaj, precum cele din spatele chatboturilor AI, sunt antrenate pe trilioane de cuvinte din cărți, articole și site-uri, dar pentru spargerea codurilor istorice există mult mai puține date disponibile.

Printre materialele colectate se află și 400 de cărți poștale misterioase, scrise în cifru la sfârșitul secolului al XIX-lea și începutul secolului XX. Fragmentele descifrate până acum sugerează că unele erau scrisori de dragoste în germană.

Echipa lui Megyesi a creat și un instrument de tip chatbot care combină transcrierea și decriptarea într-un singur proces. Sistemul folosește algoritmi antrenați pe perechi de caractere codificate și textul pe care îl reprezintă, modele lingvistice antrenate pe texte istorice din diferite perioade și algoritmi de recunoaștere a imaginilor.

Când cercetătorii au testat instrumentul pe cifrul Borg, acesta a reușit să decodeze și să traducă în engleză un fragment de 500 de simboluri în puțin peste 29 de minute. În plus, a documentat procesul și a explicat de ce soluția propusă este plauzibilă - un detaliu important, deoarece cercetătorii trebuie să se asigure că AI nu inventează interpretări.

Instrumentul a fost testat și pe alte două cifruri deja descifrate, din perioade și limbi diferite, și a reușit să le decripteze rapid. Pentru Megyesi, valoarea AI constă în „scală, viteză, descoperirea tiparelor și integrarea sarcinilor”.

Tehnologia ar putea ajuta nu doar la descifrarea documentelor istorice codificate, ci și la studierea unor texte antice scrise în alfabete pe care nimeni nu le mai poate citi astăzi. Discul din Phaistos, vechi de aproximativ 4.000 de ani și descoperit în Creta, rămâne nedescifrat, la fel ca sistemul de scriere Linear A, folosit într-o formă timpurie a limbii grecești.

„Ceea ce mă entuziasmează nu este doar posibilitatea de a rezolva un anumit puzzle istoric, ci perspectiva de a crea metode care pot ajuta cercetătorii în multe cazuri diferite”, spune Megyesi.

Adaugă spotmedia ca sursă preferată în Google