Elon Musk支持的OpenAI正在教授机器人如何像人类一样学习

2019-05-27 17:21:12 编辑：来源：

导读总部位于旧金山的非营利性研究实验室OpenAI，由Elon Musk支持，今天宣布其机器人工作的研究里程碑。该成就是一种新算法，它允许人类通过首

总部位于旧金山的非营利性研究实验室OpenAI，由Elon Musk支持，今天宣布其机器人工作的研究里程碑。该成就是一种新算法，它允许人类通过首先在虚拟现实中执行任务来将任务传达给AI。该方法基于所谓的一次性模仿学习，这是一种OpenAI开发的技术，允许软件仅使用一个示例来指导机器人模仿物理动作。

在这种情况下，OpenAI正试图教一个机器人手臂如何堆叠一系列彩色立方体形状的块。佩戴VR耳机的人首先在虚拟环境中手动执行任务。OpenAI然后有它的视觉网络 - 一种在数十万个模拟图像上训练的神经网络 - 观察动作。这部分过程基于之前的OpenAI研究，该研究侧重于使用具有不断变化的变量的模拟数据来训练AI。

因为收集真实世界的图像是密集的，昂贵的和耗时的，所以与模拟数据实现类似的效果更快且更有效。在这种情况下，OpenAI选择不使用其设置的真实照片，而是选择为其算法提供大量的桌面虚拟图像和具有不同风格的背景，光照效果和纹理的块。这样做允许算法在分析来自机器人的摄像机馈送时，在没有看过它的情况下理解场景。

然后，OpenAI的算法从视觉网络中收集信息，并将其提供给第二个神经网络，称为仿制网络，引导机器人手臂。它怀疑该行动的意图应该是什么，然后通过预测人类演员在类似情况下会做什么来模仿它。当然，棘手的部分是块每次都有不同的颜色和排列，但软件可以堆叠三个独立的双立方体堆栈，无论初始设置如何：

所有这一切都只使用模拟数据完成，而不是通过显示机器人视频或真实世界示例的照片。“我们的机器人现在已经学会了执行任务，即使它的动作必须与演示中的动作不同，”OpenAI技术人员Josh Tobin在一个用于演示新算法的视频中解释道。“通过对任务的单一演示，我们可以在许多不同的初始条件下复制它。教导机器人如何构建不同的块安排只需要一次额外的演示。“

这里的长期目标是让AI能够快速学习新的行为，并利用这些知识来适应环境中不可预测的变化。托宾说：“婴儿天生具有模仿其他人所做的事情的能力。” “模仿可以让人类快速学习新的行为。我们希望我们的机器人能够以这种方式学习。“