4 月 2 日,2017 中国(深圳)IT 领袖峰会正式开幕,在高端对话环节,腾讯董事会主席兼首席执行官马化腾、百度创始人、董事长兼首席执行官李彦宏、微软全球执行副总裁沈向阳与神州数码控股有限公司董事局主席郭为围绕“人工智能:中国机遇与挑战”为主题,进行了对话。
针对主持人吴鹰为什么重视人工智能、对人工智能有什么看法的提问,马化腾就腾讯本身在人工智能上的布局进行了回答。
马化腾介绍,腾讯在业务层面,比如社交网络业务、后台数据分析等都已经用上人工智能,只是大家感受不到,这是在后端,现在腾讯想在前端做出一些产品。
AlphaGo 通过人机对战让全世界对人工智能的认知到了新的高潮,腾讯的团队也本着练手的心态在做尝试。
“绝艺和 AlphaGo 不同的是,我们 AI 全程得到国内顶尖棋手的指导。”
不久前腾讯旗下围棋 AI 绝艺在日本 UEC 比赛中获得冠军,马化腾认为,绝艺赢得比赛是小小的成功,不能过于欣喜,但是也不能说这是一个毫无意义的事情。
对于人工智能的意义,马化腾表示,AlphaGo 给业界带来的最大触动在于,以后在很多领域如果能做出模拟器定义参数自己学习、找到规律,会远超人类的想象。
“AlphaGo 出来以后经过了十亿盘对弈超越了过去人类所有交战的盘数,自己寻找规律,对人类认知的范围极大的扩展,这给人类很大的启示。”
在对话中,主持人吴鹰提问,“人工智能是通过模拟人脑的思维方式,还是完全不同的路径实现飞跃”?
对此,马化腾表示,我们期待有本质性的飞跃,但其实现在 AI 都是圈定在一个比较窄的领域,通过各种参数训练,属于很窄的技能模拟,现阶段要研发出通用的 AI 很难。
马化腾认为,从现在的研究状态到下一步实现通用人工智能,是不是能够超越当前的碳基智慧、是不是其他的元素有可能形成更高级的生命和智慧,超越人类现在发现的知识?答案是有可能的。
对于腾讯是否有可能将业务数据开放出来给创业公司使用的可能,马化腾表示,分享是大方向,需要逐步来做。要回答这个问题首先需要了解发展人工智能的四个方面:场景、大数据、计算能力和人才。
马化腾介绍,技术如果没有场景落地、平台业务支持的话基本很难往下走,而业务产生的大量数据则需要进行标签化和清理,因为里面有很多垃圾数据对发展 AI 并没有实际用处;在计算能力上需要布局云资源,拿出几十万核的计算能力;最后是人才,腾讯过去一年招了很多人工智能方面的人才。
另外还有一个用户很关注的是数据安全问题,研究人工智能使用数据的前提是要保护个人信息安全和个人隐私问题,“如果数据不进行脱敏,我们是绝不能用的,只有先进行脱敏处理,没有人能够通过数据倒到某个人,这样处理干净才可以谈下一步。”
基于以上发展人工智能的基础,马化腾表示,关于数据开放业界在向互惠互利的大方向走,但是数据要什么模式、怎么清理、做什么标签才能给其他部门、其他公司使用,还需要探讨,并建立标准和规则。
附马化腾问答实录:
吴鹰:为什么重视人工智能?有什么看法?
马化腾:在公司内部结合业务形态我们已经有一些业务,比如微信朋友圈和 QQ 空间我们有上十亿的人脸照片,在国内有相当长的研究,包括后台数据分析,都用上人工智能技术,只是大家感受不到,这是在后端,在前端希望做出一些产品。
AlphaGo 通过人机对战的事件让全世界对人工智能的认知到了新的高潮,团队也本着练手的心态做尝试。Google 收购的 DeepMind 团队论文发表之后,全世界原来做计算机围棋的团队走入瓶颈的团队都用人工智能的方式来做,纷纷采用深入学习的方法融入到围棋的软件开发。
我们内部团队有三个团队在做,在不同的部门,这个部门刚好可以突破这个瓶颈。更大的特点,和 AlphaGo 不同的是,我们 AI 全程得到国内顶尖棋手的指导,我们十几位研发人员不懂围棋,一开始连黑先下还是白先下规则都不知道,所以结合计算机原理以及很多专家的训练。
绝艺赢得比赛是小小的成功,不能过于欣喜,但是也不能说这是一个毫无意义的事情。
过去对 AI 很多从一些规则或者简单的训练得出来能够改善计算处理的能力,最终发现一个更同步和更深层的意义,能够在计算机的后台用云计算大数据的方式去高速学习,可以自己跟自己对弈。
AlphaGo 出来以后经过了十亿盘对弈超越了过去人类所有交战的盘数,自己寻找规律,对人类认知的范围极大的扩张,这给人类很大的启示。在很多领域,围棋以外的,金融、医疗、病理的检测,如果用计算机后台做出模拟器,充分的尝试。就如自动驾驶一样,模拟做各种各样的反馈,自然会琢磨出一套理论和经验,给我们带来很大的思考。以后在很多领域如果能做出模拟器定义参数自己学习,找到规律的能力远超我们想象的,这是我们得到最大的启发。
问:人工智能要取得突破性进展,是模仿人的神经网络、人脑的效率,通过仿生人脑思维的方式突破,还是完全不一样的方式?
马化腾:我们期待有本质性的飞跃,比如说发现飞机的空气动力学、流体动力学和鸟不一样的,车轮和人型马一样,仿生是某些垂直的领域,包括围棋是选非常窄的领域,通过各种参数训练。
郭为刚提到用 AlphaGo 下一盘棋消耗多少能源,垂直领域训练消耗能源,但是实际用消耗不了多少。现在训练出来的单机版本跟职业棋手差不多,训练需要很长时间,最麻烦的是改一个参数,规则改一点、算法改一点,全部重新来消耗很大,所以这属于很窄的技能模拟。
未来下一步到通用的,再下一步是不是有更本质性的发现背后的原理,智能其实可以超越现在碳基智慧,是不是有其他的元素可以形成更高级的生命和智慧呢?这是超越人类现在发现的知识,这是有可能的。
有人突发奇想说,现在认识的宇宙是高智能生命用量子计算模拟出来的环节,一切都是模拟起来的,这是发挥大家脑洞大开的想象力吧。
吴鹰:有没有可能把数据分享出来,让这些创业公司来用?
马化腾:这个问题在内部也有讨论。首先,人工智能关注哪几块:场景、大数据、计算能力、人才。
场景,想把技术应用在什么情景下?是不是高频跟用户接触,这是落地很重要的地方。我们看到研究院、研发团队,如果没有场景落地、平台业务支持的话,基本上很难往下走。
大数据,也是平台、业务部门里面有大量的实际运转数据产生出来,这里面很多大数据是垃圾数据,没有标签、没有人规划定义,用算法也学不出来,学完之后也是走火入魔疯狂的结果,这里面数据的清洗标签化难度相当高,要雇很多人,用比较笨的方法用人脑去清洗干净再让 AI 去学,这个过程是混合的过程。
计算能力,云资源,这方面我们也要做云,要拿几十万核的计算能力 CPU 还是有能力的,而且在云里面本身有比较好的调用。
人才,通过一年的时间招了很多人,包括在西雅图还设了一个实验室。
我们观察到很多 AI 的大佬们,更关注怎么落地,把毕生的研究成果体现出来。内部 BG 之间也在沟通微信、手机 QQ 平台数据能不能用?大家知道,BG 或者部门里面平台他们也很希望近水楼台先得月,数据在身边流动为什么不让人先研究一把,所以现在我们处在内部怎么把数据分享出来的阶段。
还有一个用户很关注的是个人因素,就是你不要把我的数据都卖了。这里面有很重要的个人信息安全和个人隐私的问题,如果数据不进行脱敏,我们是绝不能用的,只有先进行脱敏处理,没有人能够通过数据倒推到某个人,这样处理干净才可以谈下一步。
数据要什么模式,清理做什么标签才能给其他的部门,包括外部合作伙伴怎么用。同时也有很多的数据是来自于合作伙伴或者业界的其他公司,他们也遇到这样的问题,拿到一堆裸数据不知道怎么用,业界要形成一个标准互惠互利,这个路径还有很长时间,大方向在往前走。