Il programma per computer può vedere 5 minuti nel futuro

Gli scienziati informatici dell'Università di Bonn in Germania hanno sviluppato a programma per autoapprendimento che può guardare diversi minuti nel futuro.   

Questo sviluppo consentirà ai robot di anticipare le azioni degli umani, consentendo alle macchine di lavorare fianco a fianco con le persone.

"Se l'azione che un robot dovrebbe fare dipende dall'azione di un essere umano, il robot deve anticipare le azioni future dell'essere umano", ha detto Jürgen Gall, professore presso l'Institute of Computer Science di Bonn e capo ricercatore dello studio.

Usando questo software, i robot possono fornire all'uomo le parti, gli strumenti o gli ingredienti necessari al momento giusto.   

"Nessuno vuole aspettare un robot", ha detto Gall.

Gall e il suo team presenteranno il loro lavoro all'annuale 2018 Conferenza sulla Computer Vision e Pattern Recognition, Giugno 19-21, a Salt Lake City.

Lavorare con gli umani

L'obiettivo finale di questo studio in corso è quello di insegnare ai robot a prevedere il tempo e l'arco delle attività, minuti o ore prima che accadano.

Questo sviluppo potrebbe facilmente applicarsi ai robot che puliscono e lavorano in cucina.

Un robot da cucina potrebbe passare gli ingredienti a un cuoco non appena necessario, preriscaldare il forno e far sapere a un cuoco se ha saltato un passaggio.

Un robot che pulisce l'aspirapolvere potrebbe sapere di evitare la cucina intorno all'ora di cena e di spostarsi in una stanza meno trafficata.  

"I robot devono anticipare le azioni future degli umani, altrimenti non saranno in grado di fare l'azione giusta al momento giusto e le collaborazioni uomo-robot rimangono frustranti per gli umani", ha detto Gall.

Formazione del programma per computer

Per addestrare il programma, i ricercatori hanno mostrato a 40 video di sei minuti di persone che preparano diverse insalate, che il programma ha "guardato" per quattro ore.

 

In ogni video, c'erano circa 20 diverse azioni con dettagli precisi circa l'ora di inizio e la durata di ogni azione.

Dall'osservazione dei video, il programma ha imparato l'ordine in cui diversi chef aggiungono i loro ingredienti. Il programma può quindi utilizzare questa conoscenza per prevedere azioni future in situazioni nuove e simili.

"Se la rete viene addestrata, anticipa le azioni future in video mai visti prima", ha affermato Gall.

Test del programma

Per testare l'efficacia del processo di apprendimento, i ricercatori hanno mostrato i video del programma che non aveva mai visto prima.

I ricercatori hanno informato il programma cosa è successo nella prima percentuale 20 o 30 di uno dei nuovi video e gli hanno chiesto di prevedere cosa sarebbe successo nel resto del video.

"La precisione era superiore al 40 per cento per brevi periodi di previsione, ma poi è stata abbandonata quanto più l'algoritmo doveva guardare al futuro", ha detto Gall in una dichiarazione.

Quando è stato chiesto al programma di prevedere attività che si sono verificate più di tre minuti in futuro, il tasso di precisione è sceso al 15%.

Tuttavia, i ricercatori non hanno lasciato facilmente il programma. L'hanno considerato corretto solo se prevedeva sia l'attività che i tempi.

Sebbene questo tasso di successo possa non sembrare ancora impressionante, serve come base per la tecnologia che potrebbe presto avere un'intuizione più grande degli umani.

Quali sono le prospettive di #GHOFOSS?

I ricercatori vogliono chiarire che questo studio è solo il primo passo verso un nuovo campo.

Stanno lavorando per migliorare la capacità del programma di prevedere cosa succede nel primo trimestre di un video, perché ha funzionato molto peggio se i ricercatori non gli avessero dato un suggerimento.

Desiderano anche limitare le annotazioni utilizzate in ciascun video esplicativo.

"Vogliamo che l'approccio apprenda direttamente dai video senza ulteriori annotazioni", ha affermato Gall.

"Sebbene abbiamo già realizzato importanti progressi in questa direzione, esiste ancora un divario di prestazioni rispetto a una rete che è formata su video in cui vengono annotati l'inizio e l'endpoint di ogni azione".

Inoltre, i ricercatori riconoscono che il futuro non è del tutto deterministico e contiene molteplici risultati potenziali.  

Nel tentativo di rendere la macchina il più possibile informata, i ricercatori stanno lavorando per espandere la loro varietà di video di formazione.

Complessivamente, c'è ancora molta strada da percorrere, ma questa ricerca funge da trampolino di lancio per lo sviluppo di un nuovo tipo di robot in grado di lavorare a fianco degli umani senza dover dire cosa fare.

Forse un giorno presto un aiutante di robot potrebbe svegliarti con uova e pancetta sabato mattina, senza che tu debba programmarlo.

La Rete Università