Instagram a oferit noi detalii despre modul în care aplicația sa folosește machine learning pentru a selecta conținutul pentru utilizatori, subliniind că, atunci când face recomandări, se concentrează pe găsirea de conturi despre care crede ca utilizatorii se vor bucura, mai degrabă decât postările individuale.
Intr-o postare pe blog Instagram oferă o perspectivă interesantă din culise într-un moment în care sistemele de recomandări algoritmice sunt atent analizate pentru a nu le oferi utilizatorilor un conținut periculos, propagare a urei și extremismului.
Deși Instagram nu a fost criticata cu aceeași ferocitate ca și YouTube (supranumit „The Great Radicalizer” de The New York Times), cu siguranță reteaua de socializare are partea sa de probleme. Conținutul de propagare a urei și dezinformarea prosperă pe platformă la fel de mult ca pe oricare altă rețea socială, iar anumite mecanisme din aplicație (cum ar fi caracteristica de sugerare de conturi ce pot fi urmarite) s-au dovedit că împinge utilizatorii către puncte de vedere extreme pentru subiecte precum anti-vaccinare.
Cu toate acestea, în postarea sa pe blog, inginerii Instagram explică funcționarea filei Explore, în timp ce evită problemele politice spinoase. „Este pentru prima dată când intrăm în detalii grele asupra blocurilor fundamentale care ne ajută să oferim conținut personalizat la scară larga”, a spus inginerul software de la Instagram, Ivan Medvedev.
Postarea subliniază faptul că Instagram este o retea uriașa, iar conținutul pe care îl conține este extrem de variat, „cu subiecte care variază de la caligrafia arabă la modele de trenuri si până la slime”. Aceasta prezintă o provocare pentru recomandarea conținutului, pe care Instagram o depășește concentrându-se nu pe ce postări ar putea aprecia utilizatorii ci de ce conturi ar putea fi interesati.
Instagram identifică conturi care sunt similare între ele prin adaptarea unei metode comune de învățare automată cunoscută sub numele de „încorporarea cuvintelor”. Sistemele de încorporare a cuvintelor studiază ordinea în care cuvintele apar în text pentru a măsura cât de relaționate sunt acestea. Astfel, de exemplu, un sistem de încorporare a cuvintelor ar remarca faptul că cuvântul „foc” apare adesea lângă cuvintele „alarmă” și „camion”, dar mai rar lângă cuvintele „pelican” sau „sandwich”. Instagram folosește un proces similar pentru a determina cât de legate sunt cele două conturi unul cu celălalt.
Pentru a face recomandările, sistemul Explorează începe prin a analiza „conturi seed”, care sunt conturi cu care utilizatorii au interacționat în trecut, apreciind sau salvând conținutul lor. Identifică conturi similare cu acestea, iar dintre ele, selectează 500 de bucăți de conținut. Acești candidați sunt filtrați pentru a elimina spamul, dezinformarea și „conținutul probabil care încalcă politicile”, iar postările rămase sunt clasificate în funcție de cât de probabil este un utilizator să interacționeze cu fiecare. În cele din urmă, primele 25 de postări sunt trimise pe prima pagină a filei Explorare a utilizatorului.
Există câteva lucruri de remarcat aici. În primul rând, Instagram nu este complet transparent în ceea ce privește procesul său. Nu există detalii cu privire la ce semnale sunt utilizate pentru a identifica spam-ul sau dezinformarea și nu este prea surprinzător, având în vedere că explicarea acestui lucru ar ajuta persoanele care doresc să răspândească acest tip de conținut. De asemenea, compania nu este clara în ce măsură machine learning este utilizată pentru a filtra conținuturi necorespunzătoare, un detaliu cheie având în vedere că Facebook prezintă adesea AI ca un glonț magic pentru moderare.
Daca ar fi sa luam exemplul conținutului anti-vaccinare, Instagram s-a ocupat de acest lucru exploatand în principal metodele manuale. Reteaua blochează hashtag-urile care conțin ceea ce se spune că ar reprezenta „informații false verificabile” precum „#vaccinescauseaids” și se bazează pe agenții de sănătate precum Organizația Mondială a Sănătății pentru a semnaliza posturile periculoase, pe care le elimină.
Va fi utilă utilizarea AI? Nu este clar, dar inginerul Medvedev spune că compania lucrează la asta. „De asemenea, pregătim modele AI pentru a detecta proactiv dezinformarea legata de vaccinare și pentru a lua măsuri automate”, spune el.
O alta tema abordata de Instagram referitoare la modul de afisare de continut pe Instagram este legata de faptul ca cea mai bună metodă pentru ca utilizatorii să modeleze conținutul pe care îl văd în fila Explorare este prin interacțiunea cu postarile si lucrurile pe care le plac. Dacă nu doriți să vedeți anumite tipuri de postări, atunci cel mai bun pariu este să folosiți instrumentul „vezi mai puține postări ca aceasta”, pe care il puteți accesa făcând clic pe meniul cu trei puncte din colțul din dreapta sus al fiecărei postări. Algoritmul va observa aceasta optiune si va modela continutul in functie de preferinte.