您的位置: 首页 >科技 >

Elon Musk支持的OpenAI正在教授机器人如何像人类一样学习

2019-05-27 17:21:12 编辑: 来源:
导读 总部位于旧金山的非营利性研究实验室OpenAI,由Elon Musk支持,今天宣布其机器人工作的研究里程碑。该成就是一种新算法,它允许人类通过首

总部位于旧金山的非营利性研究实验室OpenAI,由Elon Musk支持,今天宣布其机器人工作的研究里程碑。该成就是一种新算法,它允许人类通过首先在虚拟现实中执行任务来将任务传达给AI。该方法基于所谓的一次性模仿学习,这是一种OpenAI开发的技术,允许软件仅使用一个示例来指导机器人模仿物理动作。

在这种情况下,OpenAI正试图教一个机器人手臂如何堆叠一系列彩色立方体形状的块。佩戴VR耳机的人首先在虚拟环境中手动执行任务。OpenAI然后有它的视觉网络 - 一种在数十万个模拟图像上训练的神经网络 - 观察动作。这部分过程基于之前的OpenAI研究,该研究侧重于使用具有不断变化的变量的模拟数据来训练AI。

因为收集真实世界的图像是密集的,昂贵的和耗时的,所以与模拟数据实现类似的效果更快且更有效。在这种情况下,OpenAI选择不使用其设置的真实照片,而是选择为其算法提供大量的桌面虚拟图像和具有不同风格的背景,光照效果和纹理的块。这样做允许算法在分析来自机器人的摄像机馈送时,在没有看过它的情况下理解场景。

然后,OpenAI的算法从视觉网络中收集信息,并将其提供给第二个神经网络,称为仿制网络,引导机器人手臂。它怀疑该行动的意图应该是什么,然后通过预测人类演员在类似情况下会做什么来模仿它。当然,棘手的部分是块每次都有不同的颜色和排列,但软件可以堆叠三个独立的双立方体堆栈,无论初始设置如何:

所有这一切都只使用模拟数据完成,而不是通过显示机器人视频或真实世界示例的照片。“我们的机器人现在已经学会了执行任务,即使它的动作必须与演示中的动作不同,”OpenAI技术人员Josh Tobin在一个用于演示新算法的视频中解释道。“通过对任务的单一演示,我们可以在许多不同的初始条件下复制它。教导机器人如何构建不同的块安排只需要一次额外的演示。“

这里的长期目标是让AI能够快速学习新的行为,并利用这些知识来适应环境中不可预测的变化。托宾说:“婴儿天生具有模仿其他人所做的事情的能力。” “模仿可以让人类快速学习新的行为。我们希望我们的机器人能够以这种方式学习。“


免责声明:本文由用户上传,如有侵权请联系删除!

2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ280 715 8082   备案号:闽ICP备19027007号-6

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。