Il modello AI prevede il divertimento e la fluidità delle chiamate Zoom

Un nuovo studio condotto dagli scienziati della NYU rivela un modello di intelligenza artificiale in grado di prevedere la fluidità e il piacere delle videoconferenze analizzando i turni di conversazione e le azioni facciali. Questa svolta potrebbe migliorare notevolmente le riunioni virtuali, rendendole più efficienti e piacevoli.

Da quando è iniziata la pandemia di COVID-19, le piattaforme di videoconferenza come Zoom e MS Teams sono diventate parti integranti del nostro lavoro e della nostra vita sociale. Nonostante i loro vantaggi, queste piattaforme spesso soffrono di momenti imbarazzanti o improduttivi. Ora, un team di scienziati della New York University offre una soluzione high-tech per rendere le riunioni virtuali più piacevoli ed efficienti.

I ricercatori hanno sviluppato un modello di intelligenza artificiale in grado di valutare il comportamento umano durante le videoconferenze. Ciò include il monitoraggio dei turni di conversazione e delle espressioni facciali per prevedere se queste interazioni sono fluide e piacevoli.

"Il nostro modello di apprendimento automatico rivela le dinamiche intricate dell'interazione sociale di alto livello decodificando schemi sottili all'interno di segnali audio e video di base provenienti da videoconferenze", ha affermato in una nuova pubblicazione l'autore principale Andrew Chang, un ricercatore post-dottorato presso il Dipartimento di psicologia della NYU. "Questa svolta rappresenta un passo importante verso il miglioramento dinamico delle esperienze di videoconferenza, mostrando come evitare deragliamenti conversazionali prima che si verifichino".

Per creare questa meraviglia di apprendimento automatico, sono state analizzate oltre 100 ore di registrazioni Zoom. Il modello ha preso nota della voce, delle espressioni facciali e dei movimenti del corpo per identificare gli elementi di disturbo che rendevano le conversazioni meno fluide o piacevoli.

È interessante notare che il modello ha scoperto che i “silenzi imbarazzanti” erano più dannosi per la qualità degli incontri rispetto alle conversazioni sovrapposte, il che suggerisce che i dibattiti vivaci sono più favorevoli dei periodi di silenzio.

Per convalidare il modello, più di 300 giudici umani hanno esaminato lo stesso filmato della videoconferenza, valutando quanto fluidi e piacevoli trovassero gli scambi. Le loro valutazioni erano strettamente allineate con le previsioni dell'IA, confermando l'affidabilità del modello.

"La videoconferenza è ormai una caratteristica importante delle nostre vite, quindi comprendere e affrontare i suoi momenti negativi è fondamentale non solo per promuovere una migliore comunicazione e connessione interpersonale, ma anche per migliorare l'efficienza delle riunioni e la soddisfazione lavorativa dei dipendenti", ha aggiunto l'autore senior Dustin Freeman, visiting scholar presso il Dipartimento di psicologia della New York University. "Prevedendo i momenti di interruzione della conversazione, questo lavoro può aprire la strada ai sistemi di videoconferenza per mitigare tali interruzioni e agevolare il flusso delle conversazioni, manipolando implicitamente i ritardi del segnale per adattarsi o fornendo esplicitamente segnali agli utenti, cosa che stiamo attualmente sperimentando".

La ricerca del team, pubblicato negli atti della conferenza internazionale IEEE sull'acustica, la parola e l'elaborazione del segnale (ICASSP), mette in luce un progresso significativo nel campo della comunicazione virtuale, con potenziali applicazioni che potrebbero estendersi oltre le videoconferenze, a varie forme di comunicazione a distanza.

L'articolo è stato scritto congiuntamente da Viswadruth Akkaraju e Ray McFadden Cogliano, entrambi studenti laureati alla Tandon School of Engineering della New York University, e da David Poeppel, professore di psicologia alla New York University e alla Max Planck Society di Monaco di Baviera, in Germania.

Fonte: New York University