Capacitatea AI de a învinge jucători umani în jocuri precum șah și GO nu mai este surprinzătoare. La urma urmei, inteligența artificială a dovedit că își poate depăși creatorii animați în anumite sarcini, mai ales când vine vorba de procesarea și analizarea informațiilor. Dar abilitățile fizice au rămas o prerogativă umană – până acum.
Cercetătorii de la ETH Zurich au creat un robot AI cu sarcina de a învăța cum să joace popularul joc labirint. Scopul jocului este simplu: folosind două butoane, trebuie să direcționați o minge de marmură de la început până la punctul final, fără ca aceasta să cadă în găurile de pe masă.
Dar dacă l-ai jucat vreodată, știi că este de fapt destul de provocator. Explicația științifică din spatele dificultății sale este că necesită abilități motorii acute, abilități de raționament spațial – și multă practică.
Robotul, numit CyberRunner, este echipat cu două motoare (mâinile sale), o cameră (ochii săi) și un computer (creierul său), permițându-i să joace jocul la fel ca o persoană.
La fel ca un om, CyberRunner învață prin experiență, valorificând progresele recente în învățarea prin consolidare bazată pe modele, ceea ce permite AI-ului să ia decizii și să aleagă potențialele comportamente de succes prin prezicerea rezultatelor diferitelor cursuri de acțiune.
În timpul jocului, CyberRunner face observații ale labirintului și primește recompense în funcție de performanța acestuia. Păstrează o memorie a experienței colectate, pe care algoritmul o folosește pentru a afla cum se comportă sistemul. Pe baza acestor cunoștințe, este capabil să recunoască cele mai promițătoare comportamente. Drept urmare, utilizarea robotului a celor două motoare se îmbunătățește continuu, iar CyberRunner continuă să se îmbunătățească în timp ce algoritmul rulează de fiecare dată când se joacă.
Robotul a primit 6,06 ore de practică. Impresionant, a depășit recordul mondial anterior stabilit de Lars Göran Danielsson, un jucător din 1988, care a stabilit un timp de 15,41 secunde în 2022. CyberRunner a finalizat jocul în 14,48 secunde — mai rapid cu peste 6% față de deținătorul recordului uman.
În special, în timpul procesului de învățare, robotul a descoperit comenzi rapide și a găsit modalități de a înșela – un comportament pe care cercetările îl studiază ca o trăsătură umană înnăscută. Cercetătorii lideri ai proiectului, Thomas Bi și Prof. Raffaello D’Andrea, au trebuit să intervină și să-i instruiască pe CyberRunner să nu sără părți din labirint.
O versiune a lucrării de cercetare este deja disponibilă online, în timp ce Bi și D’Andrea vor deschide și proiectul pe site.
„Credem că acesta este bancul de testare ideal pentru cercetarea în domeniul învățării automate din lumea reală și AI. Înainte de CyberRunner, doar organizațiile cu bugete mari și infrastructură experimentală personalizată puteau efectua cercetări în acest domeniu. Acum, pentru mai puțin de 200 de dolari, oricine se poate implica în cercetare de ultimă oră în domeniul inteligenței artificiale”, a spus D’Andrea.
„În plus, odată ce mii de CyberRunners vor ieși în lumea reală, va fi posibil să se implice în experimente la scară largă, în care învățarea are loc în paralel, la scară globală. Ultimul în știința cetățenească!”
Puteți urmări robotul în acțiune în videoclipul de mai jos: