英伟达发布 AI 系统 Eureka,可执行复杂技能

2023-10-25 14:45:11 IP,云手机功能,合作代理,常见问题,引流,手机端,教程,直播,群控

NVIDIA10月23日的官方消息显示,一款名为 Eureka 的 AI 系统正式发布,该系统以GPT-4提供支持,可以让机器人实现执行例如“转笔”、“开抽屉”、“拿剪刀”、“双手互传球”等三十多种复杂的动作。

Eureka训练过程是一段称为奖励函数的代码进行监督的。当机器人的强化学习模型在学习过程中得出正确的结论时,该函数会“奖励”它,并在错误时对其进行惩罚,通过这种方式,强化学习模型将被引导找到操作机器人的正确方法。

为强化学习模型编写奖励函数历来是一项耗时且技术含量高的任务。据Nvidia称,这次推出的Eureka系统可以实现这个过程的自动化,系统会根据自然语言指令生成奖励函数,例如“教机械臂下棋”等。

17e840c897c3412d8821d2316389d2df.png 

Eureka在幕后使用OpenAI GPT-4将用户提示转化为奖励函数。除了提示本身之外,系统还接受所谓的环境代码作为输入,这是一种描述模拟机器人通过训练以执行新任务的代码。

Nvidia称,Eureka 不仅会生成奖励函数,还会随着时间的推移对其进行不断改进。该系统创建了多个版本的奖励函数,并通过将其应用到模拟机器人来评估工作效果,然后会分析评估结果以找出改进的机会。

Eureka 利用 GPT-4 生成出的“奖赏设计”方案可助力机器人的“试错(trial-and-error)”学习,并能够起到接替 80% 人类专家的任务,从而使机器人平均训练效率提升超过 50%。

据悉,在 Eureka 生成“奖赏设计”方案时,开发者不需要额外输入任务提示或撰写预定义的奖赏范本,再结合人工修正奖赏,最终使机器人动作更符合开发人员的意图。

Eureka系统还可以在此过程中考虑开发人员的反馈,特别是允许工程师就如何增强机器人的奖励功能提供建议,这些建议已经纳入到代码优化过程中。

河马云手机平台功能强大配套服务功能齐全,可以配合各种游戏操作,感兴趣的小伙伴可以登录体验,新注册用户将自动分配2台云手机,可以免费进行试用哦~

海外市场潜力巨大,需求多样,希望开拓海外市场的企业可选择云手机服务商Hippo Cloud实现海外推广营销。

Hippo Cloud也已正式开放使用,新注册用户可自动分配到2台云手机,试用时长24小时,大家多多关注海外板块内容~

可点击链接直接进入:https://www.hippocloudphone.com/

 

部分图文来源于网络

如有侵权请联系作者删除