Meta, proprietarul Facebook, a anunțat lansarea unui nou set de modele de inteligență artificială, printre care se numără un evaluator auto-instruit, care ar putea reduce nevoia implicării umane în procesul de dezvoltare a AI.
Anunțul vine după ce Meta a prezentat acest instrument într-un articol publicat în august, explicând modul în care acesta utilizează tehnica „chain of thought”, folosită și de modelele o1 recente ale OpenAI, pentru a emite evaluări de încredere asupra răspunsurilor altor modele.
Această tehnică presupune descompunerea problemelor complexe în pași logici mai mici, ceea ce îmbunătățește acuratețea răspunsurilor la probleme dificile din domenii precum știința, codificarea și matematica. Meta a antrenat modelul de evaluator folosind date generate exclusiv de AI, eliminând complet contribuția umană în acea etapă.
Capacitatea de a utiliza AI pentru a evalua alte AI-uri oferă o perspectivă asupra unui viitor în care agenți autonomi de AI vor putea învăța din propriile greșeli. Mulți cercetători din domeniul AI își imaginează astfel de agenți ca fiind asistenți digitali suficient de inteligenți pentru a efectua o gamă largă de sarcini fără intervenție umană.
Modelele care se auto-perfecționează ar putea elimina nevoia de „Reinforcement Learning from Human Feedback” (Învățare prin consolidare cu feedback uman), un proces adesea costisitor și ineficient care necesită experți umani pentru a verifica și eticheta corect datele.
„Sperăm ca, pe măsură ce AI devine din ce în ce mai super-uman, va deveni mai bună la a-și verifica munca, astfel încât să fie mai bună decât media umană”, a declarat Jason Weston, unul dintre cercetătorii Meta.
Alte companii, precum Google și Anthropic, au publicat cercetări similare despre „Reinforcement Learning from AI Feedback” (RLAIF), însă spre deosebire de Meta, aceste companii nu fac publice modelele lor.
Meta a mai lansat și alte instrumente AI, inclusiv o actualizare pentru modelul de identificare a imaginilor „Segment Anything”, un instrument care accelerează timpul de generare a răspunsurilor de către modelele mari de limbaj (LLM) și seturi de date destinate descoperirii de noi materiale anorganice.