Novità e trend

I robot imparano più velocemente con l'aiuto dell'uomo

4/2/2025

Traduzione: tradotto automaticamente

Nel mondo reale, i robot devono reagire a eventi imprevedibili. Un team di ricercatori ha sviluppato un metodo di addestramento che permette ai robot di farlo meglio e più velocemente.

I ricercatori dell'Università della California a Berkeley, negli Stati Uniti, hanno sviluppato un metodo di apprendimento efficiente per i robot. L'obiettivo è far sì che i robot imparino più rapidamente a svolgere correttamente i compiti nel mondo reale che richiedono destrezza e precisione. Le macchine così addestrate possono, ad esempio, assemblare scaffali Ikea, girare un uovo fritto lanciandolo in aria o eliminare con precisione singoli blocchi da una torre Jenga usando una frusta.

"Ma i robot hanno imparato più rapidamente a eseguire compiti nel mondo reale che richiedono destrezza e precisione.

"Ma i robot sono in grado di assemblare automobili da decenni", potresti pensare. Sì, perché sono programmati per i singoli passaggi e seguono sempre le stesse sequenze di programma. Tuttavia, non sono in grado di reagire a circostanze mutevoli o di assumere nuovi compiti senza istruzioni dettagliate.

Il nuovo metodo si chiama "robot".

Il nuovo metodo si chiama "Human-in-the-Loop Sample-Efficient Robotic Reinforcement Learning" (HIL-SERL in breve). Combina l'apprendimento per rinforzo, cioè l'apprendimento basato su algoritmi per tentativi ed errori, con il feedback umano e l'imitazione delle fasi di lavoro dell'uomo. Ciò significa che gli esseri umani sono coinvolti nella formazione. Ecco perché si chiama "human in the loop".

L'apprendimento nel mondo reale è più complesso

La difficoltà dell'apprendimento nel mondo reale è rappresentata dai parametri variabili. Nel mondo reale, la fisica è un fattore importante. L'intelligenza artificiale deve tenere conto di forze e masse, ad esempio per girare un uovo fritto. La posizione dell'uovo fritto nella padella è importante quanto le sue dimensioni e la sua forma. Per questo motivo i robot utilizzati dai ricercatori sono dotati di una telecamera. Un altro esempio è quello di Jolly.

Un altro esempio è il Jenga Whipping. Si tratta di una tendenza in cui persone abili usano una frusta per far cadere singoli blocchi di legno dalla pila del gioco. Affinché il robot possa fare lo stesso, deve colpire con precisione il punto giusto, valutare il movimento della frusta e colpire con la giusta forza. I ricercatori hanno utilizzato Jenga Whipping come un puro gioco di abilità per il robot.

Un altro problema è che la frusta non è un gioco di abilità.

Un altro problema è che gli scenari di allenamento nel mondo reale non possono essere ripetuti con la stessa rapidità di una partita di scacchi virtuale. Se l'uovo fritto cade a terra, il robot ha bisogno di un nuovo uovo. Se la torre Jenga si rovescia, qualcuno deve ricostruirla. Questo rende l'addestramento lungo e costoso.

Gli umani aiutano il robot a imparare

Ecco perché i ricercatori stanno sperimentando le istruzioni umane. Possono controllare il robot con un mouse speciale e mostrargli quali strategie preferisce utilizzare. Inoltre, valutano i suoi tentativi e gli forniscono un feedback. Di conseguenza, il robot ha bisogno di molta attenzione solo all'inizio per mettersi sulla strada giusta. In seguito, riesce a gestirsi con un controllo sempre minore. Alla fine dell'addestramento, il robot ha una percentuale di successo del 100%. Puoi vedere i video di questo qui.

Tra le attività che il robot impara in breve tempo ci sono anche i compiti pratici: tra le altre cose, è in grado di assemblare uno scaffale Ikea, montare una cinghia dentata su rulli e attaccare componenti alla scheda madre di un computer. Il robot esegue poi un test di funzionamento della scheda madre.

I ricercatori hanno deliberatamente incorporato delle interruzioni nel processo di apprendimento, come spostare gli oggetti o farli cadere. Il robot impara a reagire a queste situazioni inaspettate e a svolgere il suo compito.

Lo studio rappresenta una ricerca di base.

Lo studio rappresenta una ricerca di base. L'obiettivo è dimostrare che il sistema HIL-SERL può essere applicato a molte aree di attività. I risultati dovrebbero rendere più facile lo sviluppo di robot robusti e versatili.

Immagine di copertina: UC Berkeley

A 10 persone piace questo articolo

Debora Pape

Editor

Debora.Pape@galaxus.de

Si sente a casa sia davanti al PC da gaming che sull'amaca in giardino. È affascinata dall'Impero Romano, dalle navi container e dai libri di fantascienza, tra le altre cose. Fiuta soprattutto le ultime notizie dal settore IT e smart gadget.

5 commenti

later

I tuoi dati. La tua scelta.

Cerca

I robot imparano più velocemente con l'aiuto dell'uomo

L'apprendimento nel mondo reale è più complesso

Gli umani aiutano il robot a imparare

5 commenti

I robot imparano più velocemente con l'aiuto dell'uomo

Che cos'è l'apprendimento per rinforzo (RL)?

L'apprendimento nel mondo reale è più complesso

Gli umani aiutano il robot a imparare

5 commenti