难道中国人就做不出好的VR游戏?

马斯克发起的OpenAI开发了新算法,让机器人通过VR学习新技能

训练机器人的方法正在变得越来越丰富。

之前,我们报道了MIT的科学家用机器人“教育”其他机器人,这种方法简便快捷,无需编程,大大降低了训练门槛。现在,马斯克牵头投资的非盈利公司OpenAI,也提出了一种同样很简便的训练方法。

这种新方法就是通过VR来训练机器人。

OpenAI在一篇博文中介绍道:“我们已经开发了一种新的算法,人们通过在VR环境中演示,就可以教会机器人如何完成一项工作。”

这种算法被被称为单次模仿学习算法(one-shot imitation learning)。

它的特点在于,人可以通过VR向机器人传达指令。只要先由人在VR中演示一遍,它就可以学会完成某项具体任务的方法。

机器人通过VR学习

桌面上共有6个不同颜色的立方块,不管怎么摆放,最终机器人都会采用相同的顺序,摆成跟人类操作一样的结果。

这个算法是怎么让机器人做到这一切的呢?

据研究人员介绍,这种新算法是由两个神经网络支持的。

一个是视觉网络(vision network)。研究人员用不同的光线、纹理和对象的组合,生成成千上万张模拟图像,然后利用这些模拟图像来训练视觉网络。

另一个是模仿网络(imitation network),它可以观察展示的过程,分析每一个任务的目的,然后从另一个起始配置开始完成这个目的。

那么,模仿网络是如何搞明白问题的呢?

据介绍,模仿网络从几十个不同的任务中得到训练,每个任务又包括上千次演示。

每次训练,模仿网络都可以观察到两个演示案例。第一次演示,模仿网络可以全方位仔细观摩,第二次只会被展示一次。

然后,研究人员就会使用监督学习,让机器人预测演示者下一步会采取什么行动。显然,机器人必须要学习如何从第一次展示中,推测下一步的行动。

这个算法已经成功地教会了机器人如何叠方块,但是OpenAI表示,这种技术还可以应用于其他任务。

OpenAI的研究人员说,他们的目标是让机器人能够像人类一样学习。

除了这个新算法之外,本周,OpenAI还推出了一个开源的机器人模拟器Roboschool。

这款模拟器是基于增强学习研究平台OpenAI Gym而开发的,提供了十几个新的操作环境。用户可以在模拟环境中训练一个或多个机器人。

早在2016年12月,OpenAI还推出了开源平台Universe,在这个平台上,用户可以使用游戏、网络浏览器和各种软件来训练人工智能。

如今在AI的风潮之下,必定会有越来越多的算法或系统,让机器人学会各种不同的技能。机器人将变得越来越聪明的同时,也会降低训练的门槛,让更多的人可以参与进来,共同见证AI的成长。