Bătălia juridică dintre OpenAI și The New York Times pe tema datelor pentru antrenarea modelelor sale de inteligență artificială ar putea fi încă în curs de desfășurare. Dar OpenAI merge înainte în ceea ce privește acordurile cu alți editori, inclusiv cu unii dintre cei mai mari editori de știri din Franța și Spania.
OpenAI a anunțat că a semnat contracte cu Le Monde și Prisa Media pentru a aduce conținut de știri francez și spaniol în chatbotul ChatGPT al OpenAI. Într-o postare pe blog, OpenAI a declarat că parteneriatul va pune acoperirea evenimentelor curente ale organizațiilor – de la branduri precum El País, Cinco Días, As și El Huffpost – în fața utilizatorilor ChatGPT acolo unde are sens, precum și va contribui la volumul de date de instruire în continuă expansiune al OpenAI.
OpenAI scrie:
În lunile următoare, utilizatorii ChatGPT vor putea interacționa cu conținutul relevant de știri de la acești editori prin intermediul unor rezumate selectate cu atribuire și link-uri îmbunătățite către articolele originale, oferind utilizatorilor posibilitatea de a accesa informații suplimentare sau articole conexe de pe site-urile lor de știri … Facem îmbunătățiri continue la ChatGPT și susținem rolul esențial al industriei de știri în furnizarea de informații în timp real, cu autoritate pentru utilizatori.
Așadar, OpenAI a dezvăluit acorduri de licență cu o mână de furnizori de conținut în acest moment. Acum a părut o bună ocazie de a face un bilanț:
- Librăria media de stocuri Shutterstock (pentru imagini, videoclipuri și date de formare muzicală)
- The Associated Press
- Axel Springer (proprietar al Politico și Business Insider, printre altele)
- Le Monde
- Prisa Media
Cât plătește OpenAI pentru fiecare? Ei bine, nu spune – cel puțin nu în mod public. Dar putem face o estimare.
The Information a raportat în ianuarie că OpenAI oferea editorilor între 1 și 5 milioane de dolari pe an pentru a avea acces la arhive pentru a-și antrena modelele GenAI. Asta nu ne spune prea multe despre parteneriatul cu Shutterstock. Dar, în ceea ce privește licențele pentru articole – presupunând că informațiile din The Information sunt corecte și că aceste cifre nu s-au schimbat de atunci – OpenAI plătește între 4 și 20 de milioane de dolari pe an pentru știri.
Acest lucru ar putea fi mărunțiș pentru OpenAI, al cărui fond de război se ridică la peste 11 miliarde de dolari și ale cărui venituri anualizate au depășit recent 2 miliarde de dolari (conform Financial Times). Dar, după cum a remarcat recent Hunter Walk, partener la Homebrew și cofondator al Screendoor, este suficient de substanțială pentru a depăși potențialii rivali din domeniul inteligenței artificiale care urmăresc, de asemenea, încheierea de acorduri de licențiere.
Walk scrie pe blogul său:
„Dacă experimentarea este îngrădită de acorduri de licență cu nouă cifre, facem un deserviciu inovației… Cecurile acordate „proprietarilor” de date de instruire creează o barieră uriașă la intrarea pe piață pentru concurenți. Dacă Google, OpenAI și alte companii mari de tehnologie pot stabili un cost suficient de ridicat, ele împiedică implicit concurența viitoare.
Acum, dacă există o barieră la intrare astăzi este discutabil. Mulți – dacă nu chiar majoritatea – furnizorilor de inteligență artificială au ales să riște mânia deținătorilor de proprietate intelectuală, alegând să nu acorde licențe pentru datele pe care antrenează modelele de inteligență artificială. Există dovezi că platforma de generare de artă Midjourney, de exemplu, se antrenează pe baza fotografiilor din filmele Disney – iar Midjourney nu are niciun contract cu Disney.
Întrebarea cea mai dificilă este: Ar trebui ca acordarea de licențe să reprezinte pur și simplu un cost al activității și al experimentelor în domeniul IA?
Walk ar spune că nu. El pledează pentru o „zonă de siguranță” impusă de autoritățile de reglementare, care ar proteja orice furnizor de inteligență artificială – precum și întreprinderile mici și cercetătorii – de răspunderea juridică, atât timp cât respectă anumite standarde de transparență și etică.
Interesant este că, recent, Regatul Unit a încercat să codifice ceva în acest sens, exceptând utilizarea textului și a mineritului de date pentru antrenarea inteligenței artificiale de la considerațiile legate de drepturile de autor, atât timp cât este în scopuri de cercetare. Dar aceste eforturi au eșuat.