Google a făcut disponibilă tehnologia sa de filigranare pentru text generat de inteligență artificială, numită SynthID Text, prin intermediul actualizării Responsible Generative AI Toolkit și prin Hugging Face, un depozit de instrumente AI open source.
Dezvoltatorii pot utiliza acum SynthID Text pentru a determina dacă textul provine din modelele proprii de limbaj de mare capacitate, cu scopul de a facilita dezvoltarea responsabilă a AI, a declarat Pushmeet Kohli, vicepreședinte de cercetare la Google DeepMind.
SynthID detectează textul generat de AI prin observarea unui șir de cuvinte. Modelele de limbaj (LLM) folosesc tokeni pentru a procesa informația și a genera ieșirea. Acești tokeni pot fi un singur caracter, cuvânt sau expresie, iar modelele de limbaj pot prezice care token este cel mai probabil să urmeze altuia, unul câte unul.
Instrumentul va atribui fiecărui token un scor bazat pe probabilitatea apariției sale în ieșirea generată pentru o anumită solicitare. De asemenea, va „încorpora filigrane imperceptibile” direct în text în timpul distribuției tokenilor. Când ieșirea textului este verificată, SynthID compară modelul așteptat de scoruri pentru textul filigranat și cel nefiligranat, determinând dacă un instrument AI a generat textul sau dacă acesta provine dintr-o altă sursă.
Totuși, instrumentul are limitări. Tehnologia necesită cel puțin trei propoziții pentru a funcționa, iar robustetea și acuratețea sa cresc cu lungimea textului. Este, de asemenea, mai puțin eficientă pe texte factuale și pe texte generate de AI care au fost rescrise sau traduse în mod aprofundat.
„SynthID Text nu este conceput pentru a opri în mod direct adversarii motivați să provoace rău”, afirmă Google. „Cu toate acestea, poate face mai dificilă utilizarea conținutului generat de AI în scopuri rău intenționate și poate fi combinat cu alte abordări pentru a oferi o acoperire mai bună asupra tipurilor de conținut și platformelor.”
SynthID Text face parte dintr-o familie mai mare de instrumente create de Google pentru a detecta ieșirile generate de AI. Anul trecut, compania a lansat un instrument similar pentru a filigrana imaginile generate de AI.
Instrumentul Google de detectare a textului generat de AI vine într-un moment în care dezinformarea generată de AI este în creștere – la fel și detecțiile fals pozitive. Aproximativ două treimi dintre profesori raportează că folosesc instrumente de detectare a AI pentru teme și eseuri ale elevilor, iar studenții care folosesc engleza ca a doua limbă au fost victime ale detecțiilor false.