În ultimele decenii, tehnologiile de Inteligență Artificială (IA) au intrat în forță în aproape toate domeniile, de la sănătate și finanțe până la științele umaniste. Deși pare greu de crezut, cercetarea textelor antice, considerate mult timp indecifrabile sau distruse, face un salt major datorită algoritmilor de învățare automată (machine learning). Un exemplu remarcabil este descifrarea sulurilor de la Herculanum, arse în urma erupției vulcanului Vezuviu din anul 79 d.Hr., și pe care oamenii de știință au încercat să le deschidă, în zadar, timp de secole.
De la încercări eșuate la „Vesuvius Challenge”
Herculanum, oraș roman luxos de lângă Pompei, a fost acoperit de lavă și cenușă vulcanică, la fel ca vecinul său mai celebru. În ruinele sale, arheologii au descoperit sute de suluri de papirus carbonizate, depozitate într-o vilă bogată, probabil dedicată filozofiei și lecturii. Încercările de-a lungul istoriei de a despături aceste suluri extrem de fragile s-au soldat cu numeroase deteriorări, lăsând doar fragmente izolate de text.
De curând, un proiect numit Vesuvius Challenge, condus de Brent Seales de la Universitatea din Kentucky și de antreprenorul Nat Friedman, și-a propus să realizeze ceea ce părea imposibil: „desfășurarea virtuală” a sulurilor (prin tomografie computerizată de înaltă rezoluție) și detectarea urmelor de cerneală invizibile cu ochiul liber. Spre deosebire de alte scrieri care folosesc cerneluri pe bază de fier, manuscrisele de la Herculanum sunt redactate cu cerneluri pe bază de carbon, identice ca densitate cu papirusul însuși. Astfel, scanner-ul CT nu poate diferenția în mod direct fibra de papirus de urmele de cerneală.
Aici intervine IA: prin rețele neuronale complexe, cercetătorii au antrenat algoritmi care să identifice discrepanțe fine în textură. Vesuvius Challenge a oferit premii valoroase echipelor de specialiști în machine learning capabile să genereze imagini lizibile din aceste scanări. Pentru prima dată, s-au obținut fragmente coerente de text, vizibile rând cu rând, în limba greacă. Potrivit papyrologului italian Federica Nicolardi, această realizare reprezintă un moment istoric, deoarece aduce la lumină scrieri filozofice vechi de două milenii.
Ithaca, Pythia și alte proiecte IA în slujba textelor vechi
Sulurile de la Herculanum reprezintă doar un capitol dintr-o poveste mai amplă despre cum IA ajută la rezolvarea „puzzle-urilor” istorice. În laboratoarele Universității Oxford, de pildă, s-a dezvoltat proiectul Ithaca, o rețea neuronală de tip transformer care poate completa automat lacunele din inscripțiile grecești și poate sugera datarea aproximativă și regiunea de origine. Rezultatele sunt impresionante: Ithaca a reușit să întreacă specialiștii umani în acuratețe, însă cea mai mare performanță se obține atunci când experții lucrează în tandem cu modelul, atingând peste 70% precizie.
De la texte grecești și latine, tehnologia s-a extins la arhive cuneiforme babiloniene, la scrierea coreeană Hanja și până la inscripții chinezești antice (Oracle Bone Script). Trăsătura comună a acestor sisteme este capacitatea lor de a „învăța” modele lingvistice pe baza unor mari cantități de date digitalizate. Uneori, modelele trebuie adaptate la situații cu puține resurse (cum e cazul unor limbi dispărute, despre care rămân doar fragmente de text). Alteori, volumele masive de arhive — sute de mii de tăblițe de lut sau zeci de mii de pagini de cronici — sunt pur și simplu prea mari pentru a fi citite de o singură echipă umană.
Mecanismele din spatele performanței
Tehnic, două tipuri principale de rețele neuronale domină acest domeniu:
- CNN (Convolutional Neural Network): Un model care procesează imagini (fie că vorbim de papirusuri, pietre cu inscripții sau cărți scanate). Poate recunoaște caractere, semne cuneiforme ori simboluri erodate.
- RNN (Recurrent Neural Network) și transformer: Specializate în procesarea secvențială de date text. RNN-urile, în special LSTM (Long Short-Term Memory), pot prezice caractere și cuvinte lipsă. Modelele transformer (precum TimeSformer folosit la Herculanum ori arhicunoscutele GPT ale OpenAI) pot analiza contextul în paralel, identificând modele complexe în structură.
Prin combinația dintre cele două tipuri de rețele, cercetătorii pot reconstrui conținutul unei surse antice chiar și atunci când scanarea e foarte incompletă. În cazul scrierii arse de la Herculanum, un mare obstacol era descifrarea literalmente „oarbă” a cernelii pe bază de carbon. IA se bazează pe diferențele minime de textură, imperceptibile pentru un om, dar „vizibile” în regim de big data pentru algoritmi.
O nouă eră pentru studiul lumii antice
Deși este un salt major, succesul acestor metode ridică noi provocări. Pe de o parte, se pune problema accesului la date: pentru a antrena aceste rețele, este nevoie de scanări la rezoluție foarte înaltă, de imagini detaliate și de transliterații sau traduceri parțiale. Pe de altă parte, există riscul „halucinației” modelelor, când algoritmii oferă concluzii nefondate. Prin urmare, specialiștii subliniază necesitatea validării umane, a verificării inter-disciplinare și a publicării transparente a metodelor și rezultatelor.
Totuși, beneficiile sunt imense. Pe măsură ce mai multe muzee și biblioteci digitizează colecțiile, volume uriașe de manuscrise și inscripții vor putea fi cercetate masiv. Fragmentarium, un proiect pentru tabletele cuneiforme babiloniene, a găsit deja noi versiuni ale „Epopeei lui Ghilgameș” și imnuri necunoscute. Cercetătorii din Coreea au folosit IA pentru a traduce în timp-record pasaje din cronici regale care altfel ar fi durat decenii să fie interpretate manual. Aceste texte nu doar reînvie istoria, ci pot genera analize interdisciplinare despre evoluția limbilor, a ideilor și a societăților vechi.
Concluzie: IA ca partener de cercetare, nu înlocuitor
Progresele din domeniul inteligenței artificiale pot aduce la lumină texte îngropate și uitate de milenii, transformând radical modul în care înțelegem lumea antică. Totuși, tehnologia nu înlocuiește cunoștințele și experiența specialiștilor în istorie, arheologie și lingvistică. După cum subliniază papyrologul Federica Nicolardi, momentul în care a văzut primele linii dintr-un text grecesc vechi de 2.000 de ani a fost unul „magic”, dar procesul nu se poate încheia fără interpretarea umană: doar un ochi avizat și o minte antrenată pot pune fragmentele în context istoric, cultural și filozofic.
În concluzie, IA deschide calea spre recuperarea unor moșteniri culturale fabuloase, oferind instrumente fără precedent pentru „citirea” trecutului îndepărtat. În același timp, invită la o colaborare strânsă între IT-iști, paleografi, lingviști și istorici, într-o sinergie care poate revoluționa studiile clasice pentru multe generații de-acum înainte.