Facebook AI負責人勒坤：機器可以通過觀察掌握常識

Facebook AI负责人勒坤：机器可以通过观察掌握常识

Facebook 人工智能研究部门主管严·勒坤接受外媒采访时表示，机器视觉的下一个领域是让软件单纯通过观察世界来学习知识，甚至掌握常识。

以下为原文内容：

5 年前，软件的图片识别能力突然取得重大进步。它背后的人工神经网络也奠定了最近这股人工智能浪潮的基础。正是得益于这项技术，谷歌和 Facebook 现在才能让你搜索自己的照片，并由此催生了许多全新的面部识别应用。

Facebook 人工智能研究部门主管、纽约大学教授严·勒坤（Yann LeCun）就参与开辟了机器视觉的神经网络应用。他表示，这一领域仍在取得进步，甚至可以催生具备常识的软件系统。

Facebook AI负责人勒坤：机器可以通过观察掌握常识

Facebook 人工智能研究部门主管、纽约大学教授严·勒坤（Yann LeCun）

问：现在的机器视觉有多好？

答：如果一张照片里有一个占据主导的物体，要求机器对这个物体进行归类，效果会很好。只要有足够的数据，大约每个类别有 1000 个样本，便可识别出某个品牌的汽车，或者某个品种的植物或狗。我们还能识别更加抽象的类别，例如某张照片的内容是景观、日落、婚礼还是生日聚会。即使在 5 年前，也无法明确这些问题能否完全解决。但这并不意味着机器视觉问题已经解决。

问：还有哪个重要问题尚未“解决”？

答：多年以来，人们一直希望能给图片添加注释，给视频增加字幕。表面看来，已经有了一些效果极佳的演示，但实际效果并没有那么好。这些系统的能力很有局限，只能针对经过训练的特定领域展开。对于多数系统而言，如果你向其展示其他类型的照片，或者它们从没见过的异常环境，它们就会完全抓瞎。它们并不具备常识。

问：视觉与常识之间有什么关系？

答：这取决于你的沟通对象——即便在 Facebook 内部，人们对此也持有不同态度。你可以完全用语言跟一套智能系统互动。问题在于，语言是个低带宽渠道。很多信息之所以通过语言传递，是因为人类有很多背景知识来解决这些信息。

其他人则认为，为人工智能提供充足信息的唯一方式就是为其赋予视觉感知能力，这样获取的信息远多于语言。如果你告诉机器，“这是一台智能手机”，“这是一台压路机”，“有地东西能推动，有的东西推不动”，那么机器便可对世界的运行方式有一个基本的了解。就像婴儿的学习过程一样。

问：但婴儿无需明确指令便可吸收很多信息。

答：我们真正希望做的一件事情是，让机器可以仅仅通过视频或其他渠道了解许多事实，从而明白现实世界的局限。它们最终便可借此了解常识。婴儿和动物刚生下来的头几个月都会了解这些事情——他们会单纯通过观察学习大量信息。现在有很多方式可以轻而易举地骗过机器，因为他们对世界的了解非常有限。

问：具体到让软件通过观察来学习这件事情，目前取得了哪些进展？

答：我们很感兴趣的一个想法是：一套学习系统应该具备预测未来的能力。你给它展示几帧视频，它就会预测接下来发生什么。如果我们能够训练一套系统做到这一点，便可开发出无监督学习系统的底层技术。在我看来，到那个阶段就有可能出现很多有趣的事情。这种应用未必在于视觉领域——但我们在推进人工智能进步时，有很多努力都着眼于这一方面。

Facebook AI负责人勒坤：机器可以通过观察掌握常识

相关推荐