注:本文译自 Microsoft shares open source system for training drones, other gadgets to move safely on their own,
拥有正常视力的人走在街上,能轻易区分需要避让的物体,例如灌木丛、小台阶和玻璃门等,以及无需避让的物体,例如建筑物、行人的影子、玻璃的反光以及云彩等。
在多数情况下,人们也能预计到自己即将遇到什么障碍,例如知道在街角应该注意过往车辆并准备迈步跨下马路牙子。
上文提到的区分和预计的能力对人类而言相对容易,但这两种能力对基于人工智能的系统来说还是件难事。这就是为什么自动驾驶汽车或无人机送快递直至目前仍属新兴技术的重要原因之一。
而微软的研究人员们正在努力改变这一点。他们最新研究的一套新工具——AirSim,将可以供其他研究和开发人员用于训练和测试机器人、无人机以及其他功能装置,让它们能够在现实世界中自主、安全地运行。目前该工具的测试版本已在 GitHub 网站上发布。
GitHub 链接:https://github.com/Microsoft/AirSim
这套工具是“空中信息技术和机器人技术平台”(Aerial Informatics and Robotics Platform)研究项目的组成部分之一。它包含允许研究人员快速编写代码来控制空中机器人和其他功能装置的软件以及一套高度逼真的模拟器,用于收集在虚拟世界中对人工智能系统进行训练和测试所需数据,而后再将系统部署至现实世界中。
注:“空中信息技术和机器人技术平台”(Aerial Informatics and Robotics Platform)链接:https://www.microsoft.com/en-us/research/project/aerial-informatics-robotics-platform
负责该项目的微软研究员 Ashish Kapoor 说,他们希望这些工具能够推动人工智能的功能装置研发取得重大进展,使人们可以放心把开车、送快递甚至洗衣服等工作交给机器去做。
“我们的远景目标是切实创建可以在现实世界中运行的系统,”他说。该项目与许多其他人工智能研究项目的区别之处在于,后者专注于训练人工智能系统在有明确规则的任务中获得成功——例如棋类游戏。Kapoor 表示,微软这项工作则希望帮助研究人员开发更为实用的工具,在安全的前提下帮人们完成日常要做的工作。
“这就是 AI 的下一次飞跃,能真正以现实世界的系统为考量,”Kapoor 说。
模拟现实世界
假设你想教会一个空中机器人分辨墙壁和阴影的区别,你可能想要验证自己的理论而又无需让无人机撞墙数百次。
直到最近,模拟器尽管对此类测试有所协助,但其逼真程度仍不足以准确反映现实世界的复杂性。这对开发能够像人类一样准确感知周围世界的系统而言至关重要。
现在,得益于图形硬件、计算能力和算法的巨大进步,微软的研究人员表示,他们已经可以搭建能够提供更真实环境视角的模拟器。空中信息技术和机器人技术平台的模拟器以最新图形学技术为基础,可以准确地呈现阴影和光线反射等微妙事物,这给计算机视觉算法带来了重大改变。
“如果你真的想让这种高保真的感知技术发挥作用,就必须用非常逼真的细节来渲染场景——例如要设置日光的晃眼、街上的积水等场景,”首席研究软件开发工程师 Shital Shah 说。他也是模拟器的核心开发人员之一。
由于这种新型模拟器的场景十分逼真,但却并不是真的,因此研究人员可以放心将它当作一个安全、可靠且廉价的自动系统试验场。
这有两个优点:第一,研究人员可以无限次地让昂贵的无人机、机器人或其他功能装置发生“坠毁”,但又丝毫不会真正损毁价值连城的装置、破坏真实建筑物或对人身造成伤害。
第二,它允许研究人员更快、更好地进行人工智能的研究。其中包括收集用于构建算法的训练数据,教导系统做出安全的反应,并进行比如强化学习等需要大量试错的人工智能研究。
研究人员表示,这款模拟器可以帮助他们更快地实现目标,尽快在几乎不存在任何试错余地的现实世界场景中开始测试甚至应用他们的系统。
支持智能机器人系统开发
除模拟器外,空中信息技术和机器人技术平台还包含一个软件库,允许开发人员快速编写代码,以操控基于大疆和 MavLink 这两个时下最流行平台的无人机。通常情况下,开发人员必须花时间去学习这些独立的 API,并为每个平台单独编写代码。
研究人员预计不久将在该平台上添加更多工具,同时他们希望软件库和模拟器将有助于推动整个领域的发展。例如,这些工具将可以帮助研究人员开发更高超的感知能力,帮助机器人辨认其所处环境中的各项元素,并将门禁等真正的障碍与阴影等虚假的障碍区别开来。这些感知能力也将帮助机器人理解诸如自己距离某个行人有多远等更为复杂的概念。
同样,空中信息技术和机器人技术平台还可以帮助开发人员在机器人等功能装置在规划能力方面取得突破,其目的是协助功能装置预测即将发生的状况以及如何应对,就像我们人类在穿过街道时预计会有汽车驶过那样。这种人工智能会密切模仿人类在现实世界中行动的方式,这也是创建可供日常安全使用的现实系统的关键所在。
整个平台设计为可用于需要环境导航的任意类型自主系统。“实际上,我可以使用同样的代码基底来操控滑翔机或驾驶汽车,”Kapoor 说。
机器人技术的普及化
目前,研究人员在这一平台上的探索还不到一年的时间,但他们充分利用了计算机视觉、机器人学、机器学习与规划等领域过去几十年间积累的经验。Kapoor 说,他们取得了如此快速的进展,一部分原因是微软研究院的独特架构,在这里,背景迥异的研究人员很容易就能开展协作。
研究人员决定开放该项目的资源,以进一步促进可自主运转人工智能助手的研发。虽然许多人都相信未来无人机、机器人和汽车能够自行运转,但现阶段这些系统中的大多数仍然高度依赖人类的指引。
研究人员还注意到,许多机器人学和人工智能研究人员并没有时间或资源来自主开发这些工具,或者在现实世界中进行此类测试。这也是研究人员决定共享研究成果的另一个主要原因。“我们希望让机器人技术人人共享,”参与这个项目的研究员 Debadeepta Dey 说。
他们还希望空中信息技术和机器人技术平台将有助于快速启动相关协议和法规的标准化,以便规范人工智能助手在现实世界中的运转。Kapoor 指出,每个会开车的人都知道要遵循一套标准化的交通规则,例如应在道路的哪一侧行车、何时停车避让行人以及开车的限速等等;但目前还不存在针对人工智能助手的类似标准。
他说,随着自主系统日益进入主流,有了微软提供的这样一个系统,研究人员就可以开发一些最佳案例且能全面推广,以提高自主系统的安全性。“整个生态系统需要演进,”Kapoor 说。