NEW: FREE Web3 Resume Cheat Sheet DOWNLOAD NOW

创新方法利用众包反馈来加速机器人学习

在这篇文章中:

  • HuGE(人类引导探索)通过利用众包反馈来加速学习,彻底改变了人工智能培训。
  • 这种创新方法使人工智能代理能够更快地学习,即使来自非专家用户的嘈杂数据也是如此。
  • HuGE 有潜力扩大人工智能训练规模,并使机器人能够dent学习复杂的任务。

一种开创性的人工智能 (AI) 代理教学方法,即人类引导探索 (HuGE),已成为人工智能研究中的一种变革性方法。 HuGE 由麻省理工学院、哈佛大学和华盛顿大学的研究人员合作开发,使人工智能代理能够在非专家人类反馈的帮助下更快、更有效地学习新任务。 这项创新技术有望彻底改变人工智能代理获取新技能的方式,使机器人能够dent众包反馈的指导下独立学习复杂的任务。

人工智能训练的挑战

训练人工智能代理执行新任务通常涉及一个称为强化学习的过程,其中代理通过反复试验进行学习,并因更接近defi目标的行动而获得奖励。 在许多情况下,人类专家必须精心设计奖励函数,即激励人工智能代理探索和采取行动的激励机制。 然而,设计这些奖励函数可能非常耗时、效率低下,并且难以扩展,特别是对于涉及多个步骤的复杂任务。

众包反馈作为解决方案

HuGE 方法通过利用从非专家用户那里收集的众包反馈来指导人工智能代理的学习过程,从而引入了革命性的转变。 与依赖专业设计的奖励函数的传统方法不同,HuGE 允许 AI 代理更快地学习,即使在处理来自非专家的嘈杂数据时,非专家的反馈可能包含可能会干扰其他方法的错误。

解耦学习过程

HuGE 背后的研究人员将学习过程分为两个不同的部分,每个部分都由其算法驱动。 这种方法将目标选择与探索阶段分离,使代理能够通过众包反馈有效地学习。 HuGE 的两个关键组件如下:

另请参见  本周的XDC Network(XDC)带领4亿美元的令牌解锁

1.目标选择算法:这部分方法根据非专家用户的反馈不断更新。 它不是将反馈用作直接奖励函数,而是指导代理的探索。 用户通过选择更接近期望目标的状态来提供输入,从而允许代理相应地调整其探索。

2.代理探索:人工智能代理在目标选择器反馈的指导下dent 它收集数据,例如其行为的图像或视频,然后将其发送给人类用户以获得进一步的反馈。 这个循环缩小了智能体的探索范围,引导其走向有希望的路径来实现其目标。

HuGE 的好处

与传统的 AI 代理训练方法相比,HuGE 具有多种优势:

  • 更快的学习:该方法使人工智能代理能够更快地学习新任务,即使人类反馈包含错误或不准确的情况。
  • 异步反馈:HuGE 允许从全球非专家用户异步收集反馈,使其成为可扩展且多功能的解决方案。
  • 自主学习:即使反馈有限或延迟,代理也可以继续自主学习,确保持续进步。

真实世界和模拟测试

研究人员对模拟和现实任务进行了广泛的测试,以验证 HuGE 的有效性。 在模拟中,他们成功训练人工智能代理执行具有长序列动作的复杂任务,例如按特定顺序堆叠块或在复杂的迷宫中导航。 现实世界的实验涉及训练机械臂绘制形状和拾取物体,数据来自三大洲 13 个国家的非专家用户。

另请参阅  DeFi鲸鱼cash AAVE ,链接, UNI倾倒数百万

扩大规模和未来的应用

HuGE 令人鼓舞的结果以及获得非专家反馈的便利性表明它在扩大人工智能训练方面具有巨大的潜力。 未来,这种方法可以使机器人在用户家中学习并执行特定任务,而无需进行物理演示。 通过依靠众包反馈,机器人可以在非专家集体输入的指导下自主探索。

研究人员强调确保人工智能代理符合人类价值观和道德考虑的重要性。 随着人工智能代理dent学习和做出决策,道德准则和价值一致性对于其安全和负责任的部署至关重要。

未来发展方向

该团队的目标是进一步完善 HuGE 方法。 他们计划使人工智能代理能够从各种形式的通信中学习,例如自然语言和与机器人的物理交互。 此外,他们正在探索使用 HuGE 同时训练多个智能体的可能性,为协作人工智能学习开辟新途径。

人类引导探索(HuGE)标志着人工智能训练的重大飞跃,简化了教授人工智能代理新任务的过程。 通过利用非专家用户的集体智慧,HuGE 加速学习,减少对专家设计的奖励功能的需求,并为机器人自主获取复杂技能铺平道路。 随着人工智能领域的不断发展,HuGE 证明了协作和人群引导学习在塑造智能代理的未来方面的潜力。

加密大都会学院:如何撰写访谈的Web3简历 -免费备忘单

分享链接:

免责声明。 所提供的信息并非交易建议。 Cryptopolitan.com对根据本页提供的信息进行的任何投资不承担任何责任。 我们tron建议dent研究和/或咨询合格的专业人士。

阅读最多的

正在加载最常阅读的文章...

掌握加密货币新闻,在收件箱中获取每日更新

编辑的选择

正在加载编辑精选文章...
订阅加密波利坦