Google DeepMind a făcut un pas important în antrenarea roboților, dezvăluind roboți bipedali în miniatură capabili să joace o versiune simplificată a fotbalului. Această realizare, detaliată într-un studiu publicat în Science Robotics, demonstrează puterea învățării prin întărire profundă (deep reinforcement learning – deep RL) în a învăța roboți umanoizi mișcări complexe și coordonate, precum driblarea, apărarea și șutul.
O nouă frontieră pentru roboții umanoizi
Deși roboții cu patru picioare, precum Spot de la Boston Dynamics, au demonstrat o agilitate remarcabilă, roboții umanoizi au primit mai puțină atenție. Ultima realizare a DeepMind reduce acest decalaj, adaptând deep RL, o tehnică de învățare automată care optimizează acțiunile prin încercări și erori, pentru robotică bipedală. Acești roboți, antrenați inițial virtual, își demonstrează abilitățile pe teren fizic, evidențiind cum tehnologiile avansate de inteligență artificială pot deschide noi oportunități pentru mașinile umanoide.
Antrenarea „micilor Messi”
Cercetătorii DeepMind au început prin simularea a două abilități fundamentale în fotbal: ridicarea de la sol și înscrierea golurilor împotriva adversarilor neantrenați. Sistemul a avansat apoi la meciuri complete unu la unu, rafinându-și tehnicile prin competiții cu versiuni parțial antrenate ale propriei sale arhitecturi. Acest proces iterativ a permis roboților să combine fluid acțiuni precum mersul, întoarcerea și anticiparea comportamentului adversarilor.
Rezultatele au fost impresionante. Comparativ cu roboții antrenați cu instrucțiuni predefinite, roboții antrenați cu deep RL au demonstrat:
- o viteză de mers cu 181% mai mare
- întoarceri cu 302% mai rapide
- viteze de șut cu 34% mai mari
- timp de recuperare cu 63% mai scurt după cădere
În plus, roboții au afișat comportamente emergente, cum ar fi pivotarea și rotirea – acțiuni complexe care ar fi dificil de programat manual.
De la simulare la terenul fizic
În prezent, întregul antrenament are loc în simulări virtuale înainte de a fi aplicat roboților fizici. Echipa intenționează să integreze învățarea prin întărire în timp real pentru a îmbunătăți adaptabilitatea și performanța. Extinderea roboților pentru sarcini mai mari, cum ar fi competițiile RoboCup sau rezolvarea problemelor din lumea reală, va necesita dezvoltări suplimentare.
Dincolo de fotbal: implicații mai largi pentru robotică
Succesul acestor roboți care joacă fotbal evidențiază potențialul deep RL în îmbunătățirea mișcărilor bipede și a capacității de adaptare în timp real pentru diverse sarcini. Deși va mai dura ceva timp până când roboții umanoizi vor debuta pe terenuri de fotbal de dimensiuni mari sau în locuri de muncă, progrese precum acesta demonstrează cât de mult au avansat robotică și inteligența artificială – și cât de mult mai pot evolua.
Cu îmbunătățiri continue, roboții bipedi antrenați de DeepMind ar putea fi pregătiți în curând să abordeze provocări mai complexe. Până atunci, fluierul rămâne pregătit pentru următorul lor mare meci.