Innovativer Ansatz nutzt Crowdsourcing-Feedback, um das Lernen von Robotern zu beschleunigen

By Glory Kaburu
Aktualisiert: 27. November 2023 05:52 UTC

3 Minuten gelesen

410828

Inhalt

1. Herausforderungen im KI-Training

2. Crowdsourcing-Feedback als Lösung

3. Entkopplung des Lernprozesses

4. Vorteile von HuGE

5. Reale und simulierte Tests

6. Skalierung und zukünftige Anwendungen

7. Zukünftige Richtungen

Einen Link teilen:

In diesem Beitrag:

HuGE (Human Guided Exploration) revolutioniert das KI-Training, indem es Crowdsourcing-Feedback nutzt, um das Lernen zu beschleunigen.

Dieser innovative Ansatz ermöglicht es KI-Agenten, schneller zu lernen, selbst mit verrauschten Daten von nicht erfahrenen Benutzern.

HuGE hat das Potenzial, das KI-Training zu erweitern und Roboterdentzu versetzen, komplexe Aufgaben selbstständig zu erlernen.

Ein bahnbrechender Ansatz zum Unterrichten von Agenten der künstlichen Intelligenz (KI), bekannt als Human Guided Exploration (HuGE), hat sich als transformative Methode in der KI-Forschung herausgestellt. HuGE wurde gemeinsam von Forschern des MIT, der Harvard University und der University of Washington entwickelt und ermöglicht es KI-Agenten, mithilfe von menschlichem Feedback von Laien schneller und effektiver neue Aufgaben zu erlernen. Diese innovative Technik soll die Art und Weise, wie KI-Agenten neue Fähigkeiten erwerben, revolutionieren und es Robotern ermöglichen, mithilfe von Crowdsourcing-Feedback komplexe Aufgabendentzu erlernen.

Herausforderungen im KI-Training

Das Training von KI-Agenten für die Ausführung neuer Aufgaben umfasst typischerweise einen Prozess namens „Reinforcement Learning“, bei dem der Agent durch Versuch und Irrtum lernt und Belohnungen für Aktionen erhält, die ihn einemdefiZiel näher bringen. In vielen Fällen müssen menschliche Experten sorgfältig eine Belohnungsfunktion entwerfen, einen Anreizmechanismus, der den KI-Agenten dazu motiviert, etwas zu erkunden und Maßnahmen zu ergreifen. Das Entwerfen dieser Belohnungsfunktionen kann jedoch zeitaufwändig, ineffizient und schwierig zu skalieren sein, insbesondere bei komplexen Aufgaben mit mehreren Schritten.

Crowdsourcing-Feedback als Lösung

Der HuGE-Ansatz führt einen revolutionären Wandel ein, indem er Crowdsourcing-Feedback von nicht erfahrenen Benutzern nutzt, um die Lernprozesse von KI-Agenten zu steuern. Im Gegensatz zu herkömmlichen Methoden, die auf von Experten entwickelten Belohnungsfunktionen basieren, können KI-Agenten mit HuGE schneller lernen, selbst wenn sie mit verrauschten Daten von Nicht-Experten arbeiten, deren Feedback Fehler enthalten kann, die andere Methoden stören könnten.

Entkopplung des Lernprozesses

Die Forscher hinter HuGE haben den Lernprozess in zwei unterschiedliche Komponenten unterteilt, die jeweils durch ihren eigenen Algorithmus gesteuert werden. Dieser Ansatz entkoppelt die Zielauswahl von der Explorationsphase und ermöglicht es dem Agenten, mithilfe von Crowdsourcing-Feedback effizient zu lernen. Die beiden Schlüsselkomponenten von HuGE sind wie folgt:

Siehe auch XDC Network (XDC) führt diese Woche 400 Millionen US -Dollar -Token -Entsperren aus

1. Zielauswahlalgorithmus : Dieser Teil des Ansatzes wird basierend auf dem Feedback von nicht erfahrenen Benutzern kontinuierlich aktualisiert. Anstatt das Feedback als direkte Belohnungsfunktion zu nutzen, leitet es die Erkundung des Agenten. Benutzer geben Eingaben, indem sie auswählen, welcher Zustand näher am gewünschten Ziel liegt, sodass der Agent seine Erkundung entsprechend anpassen kann.

2. Erkundung des Agenten: Der KI-Agent dent seine Umgebung, geleitet vom Feedback des Zielselektors. Es sammelt Daten wie Bilder oder Videos seiner Aktionen, die dann zur weiteren Rückmeldung an menschliche Benutzer gesendet werden. Diese Schleife grenzt die Erkundungsgebiete des Agenten ein und weist ihm vielversprechende Wege zur Erreichung seines Ziels zu.

Vorteile von HuGE

HuGE bietet gegenüber herkömmlichen Methoden zur Schulung von KI-Agenten mehrere Vorteile:

Schnelleres Lernen: Der Ansatz ermöglicht es KI-Agenten, neue Aufgaben schneller zu erlernen, selbst wenn menschliches Feedback Fehler oder Ungenauigkeiten enthält.
Asynchrones Feedback: HuGE ermöglicht die asynchrone Erfassung von Feedback von nicht fachkundigen Benutzern weltweit und macht es so zu einer skalierbaren und vielseitigen Lösung.
Autonomes Lernen: Agenten können autonom weiterlernen, auch wenn das Feedback begrenzt oder verzögert ist, und so einen kontinuierlichen Fortschritt gewährleisten.

Reale und simulierte Tests

Die Forscher führten umfangreiche Tests sowohl an simulierten als auch an realen Aufgaben durch, um die Wirksamkeit von HuGE zu validieren. In Simulationen trainierten sie KI-Agenten erfolgreich darin, komplexe Aufgaben mit langen Aktionssequenzen auszuführen, etwa das Stapeln von Blöcken in einer bestimmten Reihenfolge oder das Navigieren durch komplizierte Labyrinthe. Bei realen Experimenten ging es darum, Roboterarme darin zu trainieren, Formen zu zeichnen und Objekte aufzunehmen, wobei die Daten von nicht fachkundigen Benutzern aus 13 Ländern und drei Kontinenten per Crowdsourcing gesammelt wurden.

Siehe auch DeFi Whales cash aus! AAVE , link, UNI für Millionen abgeladen

Skalierung und zukünftige Anwendungen

Die vielversprechenden Ergebnisse von HuGE und die einfache Möglichkeit, Feedback von Laien einzuholen, lassen darauf schließen, dass es ein großes Potenzial für die Ausweitung der KI-Ausbildung birgt. In Zukunft könnte diese Methode es Robotern ermöglichen, bestimmte Aufgaben im Zuhause der Benutzer zu erlernen und auszuführen, ohne dass physische Demonstrationen erforderlich sind. Indem sie sich auf Crowdsourcing-Feedback verlassen, können Roboter autonom erkunden und sich dabei vom kollektiven Input von Nicht-Experten leiten lassen.

Die Forscher betonen, wie wichtig es ist, sicherzustellen, dass KI-Agenten mit menschlichen Werten und ethischen Überlegungen in Einklang stehen. Da KI-Agentendentlernen und Entscheidungen treffen, sind ethische Richtlinien und Werteausrichtung für ihren sicheren und verantwortungsvollen Einsatz von entscheidender Bedeutung.

Zukünftige Richtungen

Ziel des Teams ist es, den HuGE-Ansatz weiter zu verfeinern. Sie planen, KI-Agenten in die Lage zu versetzen, aus verschiedenen Kommunikationsformen zu lernen, beispielsweise aus natürlicher Sprache und physischen Interaktionen mit Robotern. Darüber hinaus untersuchen sie die Möglichkeit, mit HuGE mehrere Agenten gleichzeitig zu schulen und so neue Möglichkeiten für kollaboratives KI-Lernen zu eröffnen.

Human Guided Exploration (HuGE) stellt einen bedeutenden Fortschritt im KI-Training dar und vereinfacht den Prozess, KI-Agenten neue Aufgaben beizubringen. Durch die Nutzung der kollektiven Weisheit nicht fachkundiger Benutzer beschleunigt HuGE das Lernen, verringert den Bedarf an von Experten entwickelten Belohnungsfunktionen und ebnet den Weg für Roboter, sich selbstständig komplexe Fähigkeiten anzueignen. Während sich der Bereich der KI weiterentwickelt, ist HuGE ein Beweis für das Potenzial des kollaborativen und Crowd-gesteuerten Lernens bei der Gestaltung der Zukunft intelligenter Agenten.

Cryptopolitan Academy: So schreiben Sie einen Web3 -Lebenslauf, der Interviews landet - kostenloses Cheat -Blatt

Einen Link teilen:

Lesen Sie den Haftungsausschluss

Haftungsausschluss. Die bereitgestellten Informationen sind keine Handelsberatung. Cryptopolitan.com haftet nicht für Investitionen, die auf der Grundlage der auf dieser Seite bereitgestellten Informationen getätigt wurden. Wir tron dringend unabhängige dent und/oder Beratung durch einen qualifizierten Fachmann, bevor Sie Anlageentscheidungen treffen.

Meist gelesen

Bleiben Sie über Krypto-Neuigkeiten auf dem Laufenden und erhalten Sie tägliche Updates in Ihrem Posteingang

Wahl des Herausgebers

Editor's Choice-Artikel werden geladen...

Innovativer Ansatz nutzt Crowdsourcing-Feedback, um das Lernen von Robotern zu beschleunigen

Inhalt

In diesem Beitrag:

Herausforderungen im KI-Training

Crowdsourcing-Feedback als Lösung

Entkopplung des Lernprozesses

Vorteile von HuGE

Reale und simulierte Tests

Skalierung und zukünftige Anwendungen

Zukünftige Richtungen

Einen Link teilen:

Meist gelesen

Bleiben Sie über Krypto-Neuigkeiten auf dem Laufenden und erhalten Sie tägliche Updates in Ihrem Posteingang

Wahl des Herausgebers

Melden Sie sich an und bleiben Sie an der Spitze

Folgen Sie uns