Compania-mamă pe Facebook Meta Platforms (META.O) a lansat un model AI capabil să traducă și să transcrie vorbirea în zeci de limbi, un potențial bloc de construcție pentru instrumente care permit comunicarea în timp real între diviziunile lingvistice.
Compania a spus într-o postare pe blog că modelul său SeamlessM4T ar putea suporta traduceri între text și vorbire în aproape 100 de limbi, precum și traducere completă din vorbire în vorbire pentru 35 de limbi, combinând tehnologia care era disponibilă anterior doar în modele separate.
CEO-ul Mark Zuckerberg a spus că are în vedere astfel de instrumente care să faciliteze interacțiunile dintre utilizatorii de pe tot globul în metaverse, setul de lumi virtuale interconectate pe care pariază viitorul companiei.
Meta pune modelul la dispoziția publicului pentru uz necomercial, se arată în postarea de pe blog.
Cea mai mare companie de social media din lume a lansat o serie de modele AI, în mare parte gratuite, în acest an, inclusiv un model de limbă mare numit Llama, care reprezintă o provocare serioasă pentru modelele proprietare vândute de OpenAI și Alphabet dar și unele susținute de Google.
Zuckerberg spune că un ecosistem AI deschis funcționează în avantajul lui Meta, deoarece compania are mai mult de câștigat prin aprovizionarea efectivă a creării de instrumente destinate consumatorilor pentru platformele sale sociale decât prin taxarea pentru accesul la modele.
Cu toate acestea, Meta se confruntă cu întrebări legale similare cu restul industriei în jurul datelor de formare ingerate pentru a-și crea modelele.
În iulie, comediantul Sarah Silverman și alți doi autori au intentat procese pentru încălcarea drepturilor de autor atât împotriva Meta, cât și împotriva OpenAI, acuzând companiile că le folosesc cărțile ca date de antrenament fără permisiune.
Pentru modelul SeamlessM4T, cercetătorii Meta au spus într-o lucrare de cercetare că au adunat date de antrenament audio din 4 milioane de ore de „audio brut provenit dintr-un depozit disponibil public de date web accesate cu crawlere”, fără a specifica care depozit.
Un purtător de cuvânt al Meta nu a răspuns la întrebările privind proveniența datelor audio.
Datele text provin din seturi de date create anul trecut care au extras conținut de pe Wikipedia și site-uri web asociate, se arată în lucrarea de cercetare.