在人类的努力下,人工智能的学习能力正在不断发展,但与人类相比仍有较大差距,这种差距会随着人类技术的不断进步而缩小至一个较小的范围吗?
美国《连线》杂志网络版对此问题进行了探讨,为了解决神经网络存在的各种缺陷,相关企业正在利用高斯过程和贝叶斯优化等数学知识改进人工智能技术,利用更少的数据实现与人类更加接近的学习能力。
神经网络在硅谷红得发紫,许多互联网服务都融合了各式各样的人工智能技术。然而,虽然这种技术已经能从你保存在网上的照片里辨认出猫咪,但研究人员深知,神经网络仍然存在很多瑕疵。因此,有人想知道,究竟能否利用这些形态识别系统设计出更先进、更可靠的人工智能模式。
神经网络能够通过分析庞大的数据学会各种任务,Facebook 利用这种技术来识别人脸,微软则将其用于翻译服务,谷歌也把其整合在网络搜索中。它们甚至开始帮助聊天机器人学习对话的艺术。而在无人驾驶汽车和其他自动化机器的发展过程中,这种技术同样扮演了至关重要的角色。
然而,由于必须借助添加了标签的海量技术才能发挥作用,所以神经网络并不适合所有任务。不仅如此,人工智能研究人员对于神经网络制定具体决策的原因也并不十分了解。所以,从很多方面来看,这其实就像是一个个的黑盒子。这种不透明性会引发很多严重问题:如果无人驾驶汽车撞到某人,应该如何判断背后的原因?
“深度学习最近获得了很多关注,这是理所应当的。”卡内基梅隆大学计算机科学教授托马斯·桑德霍尔姆(Tuomas Sandholm)说,他曾经参与开发了 Libratus,这套人工智能系统并未使用神经网络,但最近却在扑克比赛中超过了最优秀的人类选手。“但深度学习不会向你保证任何事情。”
事实的确如此,但由于神经网络存在这些明显缺陷,当今世界规模最大的一批科技公司都在拓宽其思考人工智能的方式,这一点从最近的招聘、收购和研发项目中便可看出端倪,甚至有很多创业公司也在向着相同的方向发展。
你可以将此视作贝叶斯统计学的崛起,这一学科的研究人员希望通过科学方法来使用人工智能技术——首先制定一个假设,然后根据数据更新这一假设——而不是像神经网络一样单纯利用数据得出结论。贝叶斯统计学家希望通过各种方式应对不确定性,为现有模型增加新证据,并完成一些神经网络并不擅长的任务。
与神经网络一样,贝叶斯统计方法可以从数据中了解各种信息,但这种机器学习模式的实施过程却有所不同。“我们感兴趣的是自动完成这种科学方法。”人工智能创业公司 Gamalon 创始人本·维格达(Ben Vigoda)说,该公司希望通过一种名为概率编程的技术拓展这一方向。
这再次提醒我们,神经网络的快速崛起带动了其他许多能够提升机器智能水平的技术发展,包括强化学习和进化计算。除此之外,机器也可以通过很多方式展开“学习”。
神秘技术
当盖里·马库斯(Gary Marcus)去年 12 月将他的那家拥有 15 名员工的创业公司卖给 Uber 时,他开发了一种新型人工智能技术。
他的公司当时名叫 Geometric Intelligence,虽然规模不大,但却目光远大。这位 47 岁的纽约大学心理学教授称,他和其他研究人员当时正在开发能像人类一样,通过少量数据学习任务的系统——这种模式有望超过深度学习网络。
马库斯认为,如果想要开发能够完全依靠自己与人类对话的设备,或者能够在公开道路上行驶的汽车,小数据系统至关重要。“如果想用深度学习的粗矿方法来解决语言和无人驾驶汽车领域的一些问题,你将永远无法获得足够的数据。”他在 Uber 去年 12 月收购 Geometric Intelligence 时说。毕竟,不可能为了学会躲避事故而在繁忙的道路上通过撞车来收集数据。“这些数据要么买不到,要么不存在。”
马库斯和他的创业伙伴、剑桥大学信息工程教授左斌·加哈拉玛尼(Zuobin Ghahramani)仍然不肯透露他们正在开发的具体技术。科技行业的这种保密模式往往会创造神秘氛围,人工智能尤其如此。但加哈拉玛尼也是一名贝叶斯统计学家。他擅长一种名为高斯过程的统计模型,这有可能在他和马库斯正在开发的产品中发挥重要作用。
高斯过程
从某种意义上讲,高斯过程是为特定问题寻找最优解决方案的一种方法。作为贝叶斯优化的基础,高斯过程已经帮助一些网站决定应该展示哪些广告,或者应该把主页设计成什么样子。Uber 正在聘请擅长高斯过程的学术人士来改进其专车服务。而谷歌也利用高斯过程帮助其控制该公司的高空互联网气球。
从本质上讲,高斯过程是判断不确定性的一种好方法。“了解你不知道的事情是件好事。”爱丁堡大学人工智能研究员克里斯·威廉姆斯(Chris Williams)说,他曾经参与撰写了关于高斯过程和人工智能的重要书籍,“满怀信心地犯下错误是你所能做的最糟糕的事情。”
在 2015 年被 Twitter 收购的 Whetlab 内部,这项技术提供了一种更好的神经网络设计方式。设计神经网络需要大量试错。与海量数据相比,软件程序的作用显得没那么重要。这是一项十分困难而耗时的任务,但高斯过程和贝叶斯优化却可以帮助人们自动完成项任务。
正如 WhetLab 创始人兼哈佛大学计算机科学家瑞恩·亚当斯(Ryan Adams)所说,这家创业公司使用“机器学习来改进机器学习”。神经网络可能受到“自信错误”的困扰,而在识别不确定性的过程中,这种优化也有助于解决这类问题。亚当斯后来离开 Twitter,加盟了谷歌的核心人工智能团队——谷歌大脑。
一些研究人员还认为,以小数据为基础的高斯过程将在推进自动化人工智能的过程中扮演至关重要的角色。“要开发真正的自动化代理,就必须能够快速适应环境。”人工智能创业公司 Prowler CEO 维绍尔·查特拉斯(Vishal Chatrath)说,他也曾与加哈拉玛尼共事,“这意味着要实现很高的数据学习效率。”
另外,查特拉斯还表示,高斯过程很容易解释。与神经网络不同,这种技术不会受到黑盒子问题的困扰。如果发生事故,完全可以找到问题根源。
别痛苦
查特拉斯已经为 Prowler 聘请了 3 位擅长这项技术的学者。该公司总部位于剑桥——加哈拉玛尼和其他擅长高斯过程及相关技术的专家也都居住于此——他们正在开发能够学会在大型多人游戏和其他数字世界中畅游的人工智能系统。这是一项复杂的工作,但他们希望借此开发出能够在真实世界中畅游的系统。
与此同时,亚马逊最近还招募了另外一位擅长贝叶斯优化的著名人工智能研究员、谢菲尔大学计算机科学家尼尔·劳伦斯(Neil Lawrence)。“别痛苦,”劳伦斯最近在博客中写道,他很认同《银河系漫游指南》里的内容,“通过引入数学工具来开发新一代深度学习方法,便可确保它们基本无害。”