Meta a recunoscut la sfârșitul săptămânii trecute că a folosit o cantitate enormă de postări publice pe Facebook pentru a-și antrena modelele AI, conform Reuters.
De ce contează acest lucru ? Ei bine pe măsură ce boom-ul AI continuă, creatorii de conținut contestă utilizarea materialelor lor de către companiile tehnologice în dezvoltarea instrumentelor AI avansate – iar în cazul Facebook, „creatori de conținut” înseamnă câteva miliarde de oameni.
După ce Meta și-a dezvăluit noii asistenți AI, președintele său pentru afaceri globale, Nick Clegg, a declarat pentru Reuters că „majoritatea” datelor de instruire folosite pentru a le dezvolta provin din postări disponibile public, inclusiv pe Facebook și Instagram.
„Am încercat să excludem seturile de date care au o mare preponderență de informații personale”, a spus Clegg pentru Reuters – cum ar fi datele de la LinkedIn.
Și pentru că există foarte mulși creatori de conținut nemulțumiți de utilizarea datelor lor, se pare că se pregătește o luptă juridică masivă între proprietarii de conținut protejat prin drepturi de autor, cum ar fi cărțile și produsele media profesionale, și companiile de inteligență artificială care ar putea să fi folosit în mod intenționat sau din neatenție lucrările pentru a-și instrui programele.
Meta a revendicat întotdeauna o varietate de drepturi asupra conținutului postat de utilizatorii săi, așa că din punct de vedere legal se află într-o situație diferită față de companiile care folosesc texte protejate prin drepturi de autor.
Compania le spune utilizatorilor „dețineți tot conținutul și informațiile” pe care le postați. Dar dacă faci o postare publică, așa cum fac mulți în mod implicit, aceasta devine disponibilă pentru tot felul de scopuri pe care nu le poți controla.
Clegg a declarat pentru Reuters că Meta, la fel ca multe alte firme de tehnologie, consideră că utilizarea postărilor pentru a instrui AI este acoperită de doctrina legală a utilizării loiale – dar a adăugat: „Bănuiesc cu tărie că acest lucru se va desfășura în litigiu”.
În acest context, de exemplu, Medium, platforma veche de un deceniu pentru articole de format lung, le-a spus recent utilizatorilor săi că va bloca crawler-ul web al OpenAI și va rezista altor eforturi ale companiilor AI de a recolta conținutul pentru a-l folosi pentru instruire.