infos.ro

Câinele robot învață să meargă pe teren dificil în doar 20 de minute

Autor:, www.newscientist.com

Gazonul cu iarbă și traseele de drumeții nu reprezintă o problemă pentru acest robot, care a învățat să meargă pe ele din mers datorită unui algoritm de învățare automată.


Tehnologie


26 august 2022


Un câine robot poate învăța să meargă pe terenuri nefamiliare și greu de stăpânit, cum ar fi iarba, scoarța și traseele de drumeții, în doar 20 de minute, datorită unui algoritm de învățare automată.

Majoritatea roboților autonomi trebuie programate cu grijă de oameni sau testate pe larg în scenarii simulate înainte de a putea îndeplini sarcini din lumea reală, cum ar fi mersul pe un deal stâncos sau pe o pantă alunecoasă – și când întâlnesc medii nefamiliare, au tendința de a se lupta.

Acum, Serghei Levine de la Universitatea din California, Berkeley, și colegii săi au demonstrat că un robot care folosește un tip de învățare automată numită învățare prin întărire profundă poate afla cum să meargă în aproximativ 20 de minute în mai multe medii diferite, cum ar fi un gazon cu iarbă, un strat de scoarță, o saltea din spumă cu memorie și un traseu de drumeții.

Robotul folosește un algoritm numit Q-learning, care nu necesită un model de lucru al terenului țintă. Astfel de algoritmi de învățare automată sunt utilizați de obicei în simulări. „Nu trebuie să înțelegem cum funcționează de fapt fizica unui mediu, doar punem robotul într-un mediu și îl pornim”, spune Levine.

În schimb, robotul primește o anumită recompensă pentru fiecare acțiune pe care o realizează, în funcție de cât de reușit a avut în funcție de obiective predefinite. El repetă acest proces continuu în timp ce compară succesele sale anterioare până când învață să meargă.

„Într-un anumit sens, este foarte asemănător cu modul în care oamenii învață”, spune membrul echipei Ilya Kostrikov, tot la Universitatea din California, Berkeley. „Interacționează cu un anumit mediu, primește ceva utilitate și, practic, gândește-te la experiența ta din trecut și încearcă să înțelegi ce ar fi putut fi îmbunătățit.”

Deși robotul poate învăța să meargă pe fiecare suprafață nouă pe care o întâlnește, Levine spune că echipa ar trebui să ajusteze sistemul de recompensă al modelului dacă robotul dorește să învețe alte abilități.

A face ca învățarea prin consolidare profundă să funcționeze în lumea reală este greu, spune Chris Watkins la Royal Holloway, Universitatea din Londra, din cauza cantității de variabile și date diferite care trebuie să interacționeze în același timp.

„Cred că este foarte impresionant”, spune Watkins. „Sincer, sunt puțin surprins că poți folosi ceva la fel de simplu precum Q-learning pentru a învăța abilități precum mersul pe diferite suprafețe cu atât de puțină experiență și atât de rapid în timp real.”

Referinţă: arxiv.org/abs/2208.07860

Mai multe despre aceste subiecte:

You might also like