2017 年3 月22 日,科技圈被吴恩达离职百度的事件刷屏。人工智能顶级人才的流动近年来一直引人注目。人才,是目前各科技公司想要发展人工智能的关键。
目前各大科技巨头(也包括中国的)重金拉拢机器学习人才情况屡见不鲜。腾讯自然也不例外,从2015年筹备,到2016 年4 月成立,腾讯AI Lab 在一年多的时间里,这家低调的人工智能研究机构已经拥有了50 多位AI 科学家和200 多位AI 应用工程师。最近,腾讯AI Lab 宣布了张潼、俞栋的加入,宣示着他们快速扩展的节奏。
AI Lab 在腾讯的战略地位
中国互联网公司上半场靠人口红利,通过产品多样性就能够占有一定的市场空间。现在下半场就是看技术。
「中国互联网公司上半场靠人口红利,通过产品多样性就能够占有一定的市场空间。现在下半场就是看技术。这是Pony 在演讲中说过的一句话(Pony 是马化腾在大学期间为自己取的英文名字)。」腾讯副总裁姚星说,「这也是我们做人工智能的重要原因。」他的旁边坐着上午刚刚宣布出任腾讯AI Lab 主任的张潼。
毫无疑问,人工智能技术现已成为了科技巨头保持领先、开拓新机会的核心要素之一。似乎现在没有专门的人工智能研究机构的科技公司都不好意思说自己是科技巨头了。国外,谷歌在2011 年建立了「谷歌大脑」并开始大力发展人工智能,而在去年的I/O 大会上更是进一步喊出了「人工智能优先(AI First)」的口号;微软、Facebook 等抢夺人工智能人才、收购创业公司的举动也是一个接一个;电商巨头亚马逊也在今年2 月份开通了Amazon AI Blog 介绍自己的人工智能研究成果。国内,百度凭借多年人工智能研究与人才的积累也早早就布局了自动驾驶汽车、语音交互等领域。相比起来,作为中国三大互联网公司之一的腾讯却低调得多。
其实,腾讯AI Lab 并不是腾讯最早开始的人工智能布局。结合微信、QQ、金融等主要业务优势与领域方向,腾讯多年前就开始配设不同的实验室与业务团队。比如,2015 年底,腾讯联手港科大成立了「微信-香港科技大学人工智能联合实验室(WHAT LAB)」;隶属于腾讯社交网络事业群的腾讯优图专注于图像处理、模式识别、机器学习、数据挖掘等领域进行技术研发和业务落地,它也是机器之心最早接触的腾讯人工智能团队。
此外,腾讯还有微信模式识别中心这样的其他进行人工智能研究的团队。但我们会发现一个特点,这些团队更多的是面向腾讯的产品有针对性的进行研究,不像是谷歌的谷歌大脑、Facebook 的FAIR 旗帜鲜明的展开人工智能的基础研究。
腾讯AI Lab 的目标就是增强腾讯的人工智能原创性研究。「公司里面不只是AI Lab 有AI,各个产品也会有AI 的一些应用。但是AI Lab 更多的是做技术研究,这也是我们请张潼这种世界级的牛人来的原因。因为我们聚焦在一些技术研究、原创性的研究上面,并希望通过这种技术研究的突破去支持腾讯内更多产品在AI 使用上的发展。这是一个上下层的、相辅相成的关系。」
腾讯副总裁姚星
「我们一方面做基础研究,另一方面开发系统和工具为公司各产品线做技术支持。」张潼补充说,「AI Lab 会支持一些重点业务,并且以此积累核心技术,然后会通过平台化云服务等方式向公司内部和外部进行推广,让这些技术服务更广泛的应用场景。」
而说到从技术到应用的转化上,姚星表示:「我们AI Lab 非常像Facebook 的FAIR 和AML 两个部门的结合体,里面也有很多人是在做应用。所以从AI Lab 的组织上讲,我们的研究和应用是一个比较完整的能够自我闭环的过程。我相信我们这方面的结合会比其他的公司还更好一点,毕竟我们的Lab 里面是自带应用的,这和别的公司是不太一样的。」
即使结合微信、QQ,腾讯早就开展了人工智能的研究,但在布局上腾讯还较为落后。所以在方向上,腾讯无疑要与其他巨头的人工智能布局打差异化。
「在方向上我们偏技术研究会更多,这跟大部分的互联网主流公司是类似的。当然我们会有自己的特点。我们会面向于社交AI、内容AI、游戏AI、工具类的AI——这一块我们是比较明确和清晰的,因为这跟我们公司的特色相关。」
但在开展人工智能的优势上,这些互联网公司无疑是类似的:用户基础大、产品场景多、大数据、再加上人才。姚星说这种优势不只是腾讯公司有,中国互联网公司都有这个优势。此外,他还认为,「对华人来讲,全球范围内的AI 人才还是比较多的。」他相信华人在人工智能上是大有可为的。
这与张潼博士在上午的首届学术论坛演讲中分享的观点一致。为什么中国的AI 能够走到与美国接近的地步?他认为是因为国内的互联网企业培养了众多AI 人才,他们有很强的数据处理实战经验,非常善于利用机器学习来解决各种实际问题。
四大研究方向
围绕业务核心,专注四个领域的基础研究。
吴恩达还在百度的时候,百度的人工智能研究集成了百度大脑:语音、图像、自然语言处理等。结合腾讯的业务场景,腾讯AI Lab 将会从四个方向深耕人工智能前沿研究:计算机视觉、语音识别、自然语言处理、机器学习。
腾讯AI方向
这四个方向是腾讯AI Lab 接下来会推进的基础研究方向,但这种规划并不是首次对外公布。在今年年初的腾讯研究院年会上,姚星就介绍了围绕腾讯核心业务,腾讯AI Lab 将会开展的基础研究。
具体到技术研究,姚星说,「张潼带领着团队做着一些强化学习这些方面的技术研究。另外,张老师还在主导研究很多深层次的模型、生成式模型等,这些研究实际上都站在了世界前沿的角度。」
强化学习是现在人工智能领域里面最活跃的研究领域之一,它研究的是软件代理(agent)如何在一个环境(environment)中采取行动(action)以最大化我们想要的奖励(reward),如今声名显赫的AlphaGo 中就用到了大量的强化学习。
围绕腾讯的游戏AI 业务场景,腾讯AI Lab 也开发了围棋AI——绝艺,它在第10 届UEC 杯计算机围棋大赛中夺得冠军。
比赛后,「绝艺」团队负责人刘永升在机器之心的专访中表示,「绝艺背后是深度学习和强化学习这两个机器学习十分热门的研究领域,它的总体框架遵循AlphaGo 去年1 月在《Nature》上发表的文章,是一个纯机器学习系统,但在实践中做了超出论文的创新。」
不谋而合,张潼与姚星认为这种在实践中的超越体现了腾讯游戏业务场景带来的优势。
「因为有游戏这种场景,实际上我们只要比原来好一点就可以落地了。我们并不需要完美的方案,所以迭代性会很强。就跟我们的绝艺一样,它不是一开始就是一个世界级的高手,也是从能力一般开始慢慢成长的过程。在这种成长的过程中,我们产品只要进步一点就是有用的。」
此外,姚星透漏说他们现在已经从围棋方面转到了其他游戏方面,后面会有一些成果出来。去年DeepMind 宣布与暴雪合作,开发人工智能挑战《星际争霸》。结合腾讯自身的游戏业务,AI Lab 能否开发出适用于LOL 这样更复杂的游戏场景的人工智能呢?我们希望能够看到腾讯AI Lab 的成果。
研究经验丰富的张潼
理论基础是最重要的。
腾讯AI Lab 主任张潼博士
张潼博士是中央组织部「千人计划」特聘专家,拥有美国康奈尔大学数学系和计算机系学士,以及斯坦福大学计算机系硕士和博士学位。加入腾讯前,张潼博士曾经担任美国新泽西州立大学教授、IBM T.J Watson 研究院研究员、雅虎纽约研究院主任研究员,百度研究院副院长和大数据实验室负责人,期间参与和领导开发过多项机器学习算法和应用系统。
在机器之心的这次专访中,张潼结合自己的研究和从业经历谈了谈自己对机器学习领域研究发展的一些观点。他认为在浅层学习时代,理论对实践有很大的指导作用;虽然当今的深度学习缺乏理论基础,随着相关研究的不断深入和发展,理论将又会对实践起到重大推动作用。
在张潼刚开始相关研究的时候,深度学习还远不像现在这样火热。他说他早年在斯坦福大学博士期间研究方向是数据计算,毕业后在IBM T.J. Watson 做机器学习和自然语言方面的研究,当时是数据驱动的机器学习方法在工业界迅速发展的时期。再后来加入雅虎纽约研究院接触到互联网规模的文本和大数据分析。
后来张潼又回到了大学进行研究,这时候的研究方向就更关注机器学习的基础研究了,比如统计机器学习。他介绍说:工业界经历让我比较注重理论和实际的结合。比如2010 年左右和当时在NEC Lab 的余凯合作,做了一系列以统计机器学习理论为基础的浅层模型,代表图像分类当时世界上的最高水平,并在一些国际重要的比赛中取得冠军(比如第一届ImageNet)。近期在工业界的实践也让我对深层次的模型很感兴趣,并且现在也做一些深度学习的应用和研究。
张潼博士也是NIPS、ICML 这些世界顶级会议上发表论文最多的华人之一。在说到NIPS 会议最近的发展变化时,张潼评论说NIPS 一直以来都是机器学习领域中比较受欢迎的一个会议,因为研究方向跨学科,比较包容,可以促进大家交流,并且注重新的想法,可以开拓思路。早期时候会议比较小,但包括的范畴更广,包括神经科学、统计学,也有语音、图像等应用研究;当时比较注重新的统计模型,以及理论结合实践;现在NIPS 会议规模变大了很多,而且和其他会议更加趋同,比如NIPS 和ICML 区别就不如以前那么明显了。现在的机器学习研究更偏实际偏应用,大家快速搞一个模型或算法,调一调参数,在一些数据集得到更好结果,文章就发表了。不过NIPS 还是保持了一些原来的特色,每年都会有一些有真正创新想法的文章发表。
而研究也不能只关注实际应用,理论基础也是非常重要的。按姚星的话讲,甚至「理论基础是最重要的」。
但有时候理论却是我们一个不得不避其锋芒的问题,因为深度神经网络的复杂度,很多相关的研究实际上是在操作「黑箱」,给人带来了神经网络太复杂,理论跟不上的感觉,但张潼认为,理论研究跟不上不应该妨碍实践者自己向前走。深度学习在实践中快速发展是一个好事情,会让理论学家进行反思,思考到底能对现在这些更复杂的模型做出什么有价值的贡献。他认为在深度学习方面的理论研究今后会越来越多,也将能给实践方面的研究带来一些指导作用,就像浅层学习时代发生的情况一样。
姚星也同意张潼的看法,他说,「现在深度学习大部分是启发式的经验类的东西在起作用,缺乏一些理论。如果深度学习要走得更远,就必然要从理论上面去补上这个差。我们AI Lab 的一个很强的使命就是要让深度学习走得更远。这需要我们扎扎实实做一些基础上的研究,再做一些基础算法、理论上的研究。以应用式、经验式、启发式为主的方法的天花板是有限的,这也是张潼会来AI Lab 的一个很重要的原因。」