Un approccio rivoluzionario all’insegnamento degli agenti di intelligenza artificiale (AI), noto come Human Guided Exploration (HuGE), è emerso come un metodo trasformativo nella ricerca sull’intelligenza artificiale. Sviluppato in collaborazione da ricercatori del MIT, dell'Università di Harvard e dell'Università di Washington, HuGE consente agli agenti di intelligenza artificiale di apprendere nuovi compiti in modo più rapido ed efficace con l'assistenza del feedback umano non esperto. Questa tecnica innovativa è pronta a rivoluzionare il modo in cui gli agenti di intelligenza artificiale acquisiscono nuove competenze, consentendo ai robot di apprendere compiti complessidentcon la guida del feedback del crowdsourcing.
Sfide nella formazione sull'intelligenza artificiale
La formazione degli agenti IA per eseguire nuovi compiti implica in genere un processo chiamato apprendimento per rinforzo, in cui l'agente impara attraverso prove ed errori, ricevendo ricompense per azioni che lo avvicinano a un obiettivodefi. In molti casi, gli esperti umani devono progettare meticolosamente una funzione di ricompensa, un meccanismo di incentivazione che motiva l’agente dell’IA a esplorare e ad agire. Tuttavia, la progettazione di queste funzioni di ricompensa può essere dispendiosa in termini di tempo, inefficiente e difficile da scalare, in particolare per attività complesse che comportano più passaggi.
Il feedback in crowdsourcing come soluzione
L'approccio HuGE introduce un cambiamento rivoluzionario sfruttando il feedback crowdsourcing raccolto da utenti non esperti per guidare i processi di apprendimento degli agenti di intelligenza artificiale. A differenza dei metodi tradizionali che si basano su funzioni di ricompensa progettate da esperti, HuGE consente agli agenti di intelligenza artificiale di apprendere più rapidamente, anche quando lavorano con dati rumorosi provenienti da non esperti, il cui feedback può contenere errori che potrebbero interrompere altri metodi.
Disaccoppiamento del processo di apprendimento
I ricercatori dietro HuGE hanno diviso il processo di apprendimento in due componenti distinte, ciascuna guidata dal proprio algoritmo. Questo approccio disaccoppia la selezione dell'obiettivo dalla fase di esplorazione, consentendo all'agente di apprendere in modo efficiente con feedback in crowdsourcing. I due componenti chiave di HuGE sono i seguenti:
1. Algoritmo di selezione dell'obiettivo : questa parte dell'approccio si aggiorna continuamente in base al feedback degli utenti non esperti. Invece di utilizzare il feedback come una funzione di ricompensa diretta, guida l'esplorazione dell'agente. Gli utenti forniscono input selezionando quale stato è più vicino all'obiettivo desiderato, consentendo all'agente di adattare di conseguenza la propria esplorazione.
2. Esplorazione dell'agente: l'agente AI dent il suo ambiente, guidato dal feedback del selezionatore dell'obiettivo. Raccoglie dati, come immagini o video delle sue azioni, che vengono poi inviati agli utenti umani per ulteriore feedback. Questo ciclo restringe le aree di esplorazione dell'agente, indirizzandolo verso percorsi promettenti per raggiungere il suo obiettivo.
Vantaggi di HuGE
HuGE offre numerosi vantaggi rispetto ai metodi tradizionali per la formazione degli agenti IA:
- Apprendimento più rapido: l’approccio consente agli agenti di intelligenza artificiale di apprendere nuovi compiti più rapidamente, anche quando il feedback umano contiene errori o imprecisioni.
- Feedback asincrono: HuGE consente di raccogliere feedback in modo asincrono da utenti non esperti in tutto il mondo, rendendolo una soluzione scalabile e versatile.
- Apprendimento autonomo: gli agenti possono continuare ad apprendere in modo autonomo, anche quando il feedback è limitato o ritardato, garantendo un progresso continuo.
Test reali e simulati
I ricercatori hanno condotto test approfonditi sia su compiti simulati che nel mondo reale per convalidare l'efficacia di HuGE. Nelle simulazioni, hanno addestrato con successo gli agenti IA a eseguire compiti complessi con lunghe sequenze di azioni, come impilare blocchi in ordini specifici o navigare in labirinti intricati. Gli esperimenti nel mondo reale prevedevano l’addestramento di bracci robotici per disegnare forme e raccogliere oggetti, con dati raccolti in crowdsourcing da utenti non esperti in 13 paesi e tre continenti.
Scaling up e applicazioni future
I risultati promettenti di HuGE e la facilità di ottenere feedback da parte di non esperti suggeriscono che ha un grande potenziale per ampliare la formazione sull’intelligenza artificiale. In futuro, questo metodo potrebbe consentire ai robot di apprendere ed eseguire compiti specifici nelle case degli utenti senza richiedere dimostrazioni fisiche. Facendo affidamento sul feedback del crowdsourcing, i robot possono esplorare in modo autonomo, guidati dal contributo collettivo di non esperti.
I ricercatori sottolineano l’importanza di garantire che gli agenti di intelligenza artificiale si allineino ai valori umani e alle considerazioni etiche. Poiché gli agenti di intelligenza artificiale apprendono e prendono decisioni in mododent, le linee guida etiche e l’allineamento dei valori sono fondamentali per il loro impiego sicuro e responsabile.
Direzioni future
Il team mira a perfezionare ulteriormente l’approccio HuGE. Hanno in programma di consentire agli agenti di intelligenza artificiale di apprendere da varie forme di comunicazione, come il linguaggio naturale e le interazioni fisiche con i robot. Inoltre, stanno esplorando la possibilità di utilizzare HuGE per formare più agenti contemporaneamente, aprendo nuove strade per l’apprendimento collaborativo dell’intelligenza artificiale.
Human Guided Exploration (HuGE) segna un significativo passo avanti nella formazione sull’IA, semplificando il processo di insegnamento di nuovi compiti agli agenti AI. Sfruttando la saggezza collettiva degli utenti non esperti, HuGE accelera l’apprendimento, riduce la necessità di funzioni di ricompensa progettate da esperti e apre la strada ai robot per acquisire autonomamente competenze complesse. Mentre il campo dell’intelligenza artificiale continua ad evolversi, HuGE testimonia il potenziale dell’apprendimento collaborativo e guidato dalla folla nel plasmare il futuro degli agenti intelligenti.
Cryptopolitan Academy: come scrivere un curriculum Web3 che ottenga interviste - Cheat Sheet GRATUITO