NEW: FREE Web3 Resume Cheat Sheet DOWNLOAD NOW

Un enfoque innovador utiliza comentarios colaborativos para acelerar el aprendizaje de los robots

En esta publicación:

  • HuGE, o exploración guiada por humanos, revoluciona el entrenamiento de IA al aprovechar la retroalimentación colaborativa para acelerar el aprendizaje.
  • Este enfoque innovador permite a los agentes de IA aprender más rápidamente, incluso con datos ruidosos de usuarios no expertos.
  • HuGE tiene el potencial de ampliar la capacitación en IA y capacitar a los robots para que aprendan tareas complejasdentindependiente.

Un enfoque innovador para enseñar agentes de inteligencia artificial (IA), conocido como Exploración Guiada por Humanos (HuGE), ha surgido como un método transformador en la investigación de la IA. Desarrollado en colaboración por investigadores del MIT, la Universidad de Harvard y la Universidad de Washington, HuGE permite a los agentes de IA aprender nuevas tareas de forma más rápida y eficaz con la ayuda de comentarios humanos no expertos. Esta técnica innovadora está preparada para revolucionar la forma en que los agentes de IA adquieren nuevas habilidades, haciendo posible que los robots aprendan tareas complejas dedentcon la guía de comentarios de fuentes colaborativas.

Desafíos en el entrenamiento de IA

Entrenar a los agentes de IA para que realicen nuevas tareas normalmente implica un proceso llamado aprendizaje por refuerzo, en el que el agente aprende mediante prueba y error y recibe recompensas por las acciones que lo acercan a un objetivodefi. En muchos casos, los expertos humanos deben diseñar meticulosamente una función de recompensa, un mecanismo de incentivo que motive al agente de IA a explorar y actuar. Sin embargo, diseñar estas funciones de recompensa puede llevar mucho tiempo, ser ineficiente y difícil de escalar, particularmente para tareas complejas que involucran múltiples pasos.

La retroalimentación colectiva como solución

El enfoque HuGE introduce un cambio revolucionario al aprovechar los comentarios de usuarios no expertos para guiar los procesos de aprendizaje de los agentes de IA. A diferencia de los métodos tradicionales que se basan en funciones de recompensa diseñadas por expertos, HuGE permite a los agentes de IA aprender más rápidamente, incluso cuando trabajan con datos ruidosos de no expertos, cuya retroalimentación puede contener errores que podrían alterar otros métodos.

Desacoplar el proceso de aprendizaje

Los investigadores detrás de HuGE dividieron el proceso de aprendizaje en dos componentes distintos, cada uno impulsado por su algoritmo. Este enfoque desacopla la selección de objetivos de la fase de exploración, lo que permite al agente aprender de manera eficiente con comentarios de colaboración abierta. Los dos componentes clave de HuGE son los siguientes:

Ver también  Gobierno de los EAU y Shib A Inu para energizar la Web3 en los EAU

1. Algoritmo de selección de objetivos : esta parte del enfoque se actualiza continuamente en función de los comentarios de usuarios no expertos. En lugar de utilizar la retroalimentación como una función de recompensa directa, guía la exploración del agente. Los usuarios brindan información seleccionando qué estado está más cerca del objetivo deseado, lo que permite al agente ajustar su exploración en consecuencia.

2. Exploración del agente: el agente de IA dent su entorno, guiado por la retroalimentación del seleccionador de objetivos. Recopila datos, como imágenes o vídeos de sus acciones, que luego se envían a usuarios humanos para obtener más comentarios. Este circuito reduce las áreas de exploración del agente, dirigiéndolo hacia caminos prometedores para lograr su objetivo.

Beneficios de enorme

HuGE ofrece varias ventajas sobre los métodos tradicionales para entrenar agentes de IA:

  • Aprendizaje más rápido: el enfoque permite a los agentes de IA aprender nuevas tareas más rápidamente, incluso cuando la retroalimentación humana contiene errores o imprecisiones.
  • Comentarios asincrónicos: HuGE permite recopilar comentarios de forma asincrónica de usuarios no expertos en todo el mundo, lo que la convierte en una solución escalable y versátil.
  • Aprendizaje autónomo: los agentes pueden continuar aprendiendo de forma autónoma, incluso cuando la retroalimentación es limitada o retrasada, lo que garantiza un progreso continuo.

Pruebas simuladas y en el mundo real

Los investigadores realizaron pruebas exhaustivas en tareas tanto simuladas como del mundo real para validar la eficacia de HuGE. En simulaciones, entrenaron con éxito a agentes de IA para realizar tareas complejas con largas secuencias de acciones, como apilar bloques en órdenes específicos o navegar por intrincados laberintos. Los experimentos del mundo real implicaron entrenar brazos robóticos para dibujar formas y recoger objetos, con datos obtenidos de usuarios no expertos en 13 países y tres continentes.

Consulte también  estafadores de phishing dirigidos a usuarios de billeteras fantasmas con alertas de actualización falsas

Ampliación y aplicaciones futuras

Los resultados prometedores de HuGE y la facilidad para obtener comentarios de no expertos sugieren que tiene un gran potencial para ampliar el entrenamiento en IA. En el futuro, este método podría permitir que los robots aprendan y realicen tareas específicas en los hogares de los usuarios sin necesidad de demostraciones físicas. Al confiar en la retroalimentación colectiva, los robots pueden explorar de forma autónoma, guiados por el aporte colectivo de no expertos.

Los investigadores enfatizan la importancia de garantizar que los agentes de IA se alineen con los valores humanos y las consideraciones éticas. A medida que los agentes de IA aprenden y toman decisiones de formadent, las pautas éticas y la alineación de valores son fundamentales para su implementación segura y responsable.

Direcciones futuras

El equipo pretende perfeccionar aún más el enfoque de HuGE. Planean permitir que los agentes de IA aprendan de diversas formas de comunicación, como el lenguaje natural y las interacciones físicas con robots. Además, están explorando la posibilidad de utilizar HuGE para capacitar a varios agentes simultáneamente, abriendo nuevas vías para el aprendizaje colaborativo de la IA.

La exploración guiada por humanos (HuGE) marca un importante avance en el entrenamiento de IA, al simplificar el proceso de enseñar nuevas tareas a los agentes de IA. Al aprovechar la sabiduría colectiva de los usuarios no expertos, HuGE acelera el aprendizaje, reduce la necesidad de funciones de recompensa diseñadas por expertos y allana el camino para que los robots adquieran habilidades complejas de forma autónoma. A medida que el campo de la IA continúa evolucionando, HuGE es un testimonio del potencial del aprendizaje colaborativo y guiado por la multitud para dar forma al futuro de los agentes inteligentes.

Academia Cryptopolitan: Hoja de trucos de currículum Web3 gratis - Descargar ahora

Compartir enlace:

Descargo de responsabilidad. La información proporcionada no es un consejo comercial. Cryptopolitan.com no asume ninguna responsabilidad por las inversiones realizadas en función de la información proporcionada en esta página. Recomendamos tron dent independiente y/o la consulta con un profesional calificado antes de tomar cualquier decisión de inversión.

Mas leido

Cargando los artículos más leídos...

Manténgase al tanto de las noticias sobre criptomonedas y reciba actualizaciones diarias en su bandeja de entrada

elección del editor

Cargando artículos elegidos por el editor...
Suscríbete a CryptoPolitan