Robot lär sig Rubiks kub själv
Att lösa Rubiks kub med bara en hand kräver fingerfärdighet. AI-forskare i USA har lyckats få en robot att lösa uppgiften på egen hand genom att träna i en simulator.
Det tar lite tid och rörelserna är lite klumpiga, men efter några minuter har robothanden lyckats få alla bitarna på plats i en Rubiks kub. Andra robotar har tidigare klarat det betydligt snabbare, men då har de varit specialbyggda för uppgiften. Den nya robothanden, som utvecklats av forskare vid det amerikanska företaget Open AI, kan genom träning lära sig att lösa olika uppgifter i en oförutsägbar miljö.
– Om robotar till exempel ska kunna hjälpa oss i hemmet måste de kunna lära sig nya uppgifter och ständigt anpassa sig efter nya situationer, säger Peter Welinder, en av forskarna som varit med och utvecklat robothanden, som presenteras i en ny forskningsrapport (pdf).
För att träna roboten på att lösa Rubiks kub använde forskarna samma typ av AI-algoritmer som tidigare gjort att datorer lärt sig spela avancerade datorspel genom att träna mot sig själv.
Men att lära en robot en fysisk uppgift är en annan femma. Skulle roboten öva i verkligheten skulle det ta åratal. Forskarna lät därför robothanden träna virtuellt i en simulator.
Uppgiften gjordes svårare och svårare
För att utmaningen skulle bli mer verklighetsnära utvecklade forskarna en speciell algoritm som hela tiden ställde till det för roboten genom att ändra kubens storlek, fingrarnas friktion och andra parametrar.
– Allt eftersom roboten lär sig att lösa uppgiften så gör algoritmen det sakta men säkert allt svårare. Roboten måste då lära sig på nytt, säger Peter Welinder.
Den simulerade träningen gjorde att roboten lärde sig strategier för att klara av olika situationer som den inte tränats för. När den testades i verkligheten visade det sig att den inte bara kunde lösa kuben. Roboten kunde även klara uppgiften om den stördes under arbetet. Forskarna testade till exempel att sätta en handske på handen, tejpa ihop två av fingrarna eller peta på kuben med olika föremål.
– Det var förvånande att se att den var så robust, säger Peter Welinder.
Han berättar att ju mer roboten får träna i simulatorn, desto bättre blir den.
I framtiden skulle det kunna leda till fingerfärdiga robotar som börjar närma sig människans förmåga att använda händer och fingrar.