游客

中国“阿法狗”来了 腾讯“绝艺”夺世界围棋AI冠军

游客 2017-03-21 09:00:35    201231 次浏览

半个月前,董事会主席马化腾曾对第一财经记者感慨,现在他和腾讯的焦虑在于“科技”。“掌握技术才能保证战略制高点,否则当一个浪潮来了的时候,为什么有的能做到,有的做不到?技术是一个不可逾越的东西。”当时他还透露,腾讯的AI(人工智能)除了有AI Lab 做基础性的研究外,其实在腾讯各个事业部门(BG)里都有AI的团队。

在半个月后的第10届UEC杯计算机围棋大赛上,腾讯 AI 产品亮出“肌肉”。腾讯AI Lab(腾讯人工智能实验室)中一支由13人团队研发近一年的围棋人工智能程序“绝艺”(Fine Art)首次参加比赛,一路过关斩将,在积分赛七连胜进入16强后,在决赛中经过50多分钟的“鏖战”,二度击败来自日本的 DeepZenGo,以四连胜战绩夺得本届UEC杯冠军。3月26日,“绝艺”还将在东京与日本著名新锐棋手一力辽在“电圣战”中进行人机对弈。

2007年始于日本的UEC杯,是一项传统和权威的计算机围棋大赛,每年邀请各国高水平AI齐聚东京比赛,促进相关学术及科技的交流。在腾讯“绝艺”之前,日本的DeepZenGo、法国的“疯石”(Crazy Stone)、美国公司的“黑暗森林”(Dark Forest)等世界著名计算机围棋程序先后在UEC杯折桂获奖,今年共有30家软件参赛。

“绝艺”与日本“DeepZenGo”决胜局对弈图

“很高兴‘绝艺’能够在UEC杯夺冠,这是非常难得的宝贵经验。‘绝艺’不同于其他实验室AI,它得益于世界超一流棋手的指导,通过不断与高手交流及学习,一步步成长起来。我们希望,通过‘绝艺’能够让更多人关注、喜爱进而传承围棋这一传统文化。”腾讯公司副总裁、腾讯AI Lab负责人姚星表示,“‘绝艺’在研究价值上也不止于围棋AI本身,我们在深度学习和强化学习上进行了非常有价值的探索与创新,之后将通过论文公开这些技术创新和数据库的细节。“

 为什么是围棋?

历史上,电脑最早掌握的第一款经典游戏是井字游戏,这是1952年一位博士在读生的研究项目;随后是1994年电脑程序Chinook成功挑战西洋跳棋游戏;3年后,深蓝超级计算机在国际象棋比赛中战胜世界冠军加里·卡斯帕罗夫。

除了棋盘游戏外,IBM的Watson系统在2011年成功挑战老牌智力竞赛节目Jeopardy游戏一战成名;2014年,Google自己编写的算法,学会了仅需输入初始像素信息就能玩几十种Atari游戏。

但在AlphaGo之前,有一项游戏仍然是人类代表着顶尖水平,那就是围棋。

围棋虽然看上去规则简单,却因为精妙而富有思想深度,几个世纪来都牢牢抓住了人们的想象力。例如此前Google介绍说,围棋的搜索空间是漫无边际的——比围棋棋盘要大1个古戈尔(数量级单位,10的100次方,甚至比宇宙中的原子数量还要多)。因此,传统的“强力”人工智能方法也就是“为所有可能的步数建立搜索树”,在围棋游戏中根本无法实现。

去年3月, DeepMind 团队AlphaGo 战胜李世石,而从“绝艺”研发近一年的时间表来看,腾讯AI Lab对围棋的研发就在这场人机大战之后。据腾讯人士介绍,“绝艺”名字,源自唐代杜牧的送别诗“绝艺如君天下少,闲人似我世间无”。

据介绍,腾讯的AI Lab在2016年成立,专注于人工智能的基础研究及应用探索,不断提升AI的决策、理解及创造能力,同时为腾讯各产品业务提供AI技术支撑。腾讯AI Lab的基础研究包括计算机视觉、语音识别、自然语言处理和机器学习,其应用探索包括游戏AI、内容AI、社交AI及平台AI,产品已应用在微信、QQ及天天快报等上百个产品。目前实验室有超过50余位世界知名学院的AI科学家(90%为博士)、及200多位经验丰富的工程师。

有意思的是,去年第一财经记者曾询问是否研发围棋相关的人工智能,一位百度高管否认了这种说法,他称,百度内部曾认真考虑是否和AlphaGo比赛围棋,但最后的结论是不值得,有任何 AI的资源应该先放在无人车上。

而腾讯的人工智能研发除了围棋之外,马化腾此前曾透露,AI其实在腾讯内部分好几块业务,既有AI的LAB做一些基础性的研究,也有在各个事业部门(BG)里的AI团队,例如基于人脸识别技术的优图团队,以及微信上的语音识别技术等。

 与AlphaGo一战谁赢?

如果让中国的“绝艺”与AlphaGo一战,究竟谁会赢?

一个有趣的细节是,“绝艺”曾在围棋平台上有个马甲 ID叫做“天下无狗”。不过绝艺团队昨日称,目前没收到计划与AlphaGo对弈的消息。

而与AlphaGo围棋和绝艺都对局过的古力表示,就目前情况看“还是阿尔法围棋更强,因为还没看到它的底”。

事实上,围棋的 AI涵盖了人工智能最热门的研究领域——深度学习和强化学习。

此前,GoogleAlphaGo的研究者DavidSilver说,AlphaGo系统的关键是,将围棋巨大无比的搜索空间压缩到可控的范围之内,在AlphaGo两种不同的神经网络中,“策略网络(policynetwork)”的作用是预测下一步,并用来将搜索范围缩小至最有可能引起的那些步骤。另一个神经网络“价值网络(valuenetwork)”则是用来减少搜索树的深度,每走一步估算一次获胜方,而不是搜索所有结束棋局的途径。

而根据腾讯方面的介绍来看,“绝艺”的算法与 AlphaGo 类似,主要包括人类棋谱数据库和机器自对弈,它的算法基于策略网络与价值网络两大核心,并创新性地大幅提升了价值网络的精度,使其大局观表现更好。

通俗的说,“策略”指每一步博弈时,各种选择的取舍,选好棋弃差棋,这是偏微观评估;而“价值”则指能看懂棋局,判断给定棋局是不是能赢,这是偏宏观的评估。“‘绝艺’背后‘精准决策’的AI能力,应用前景非常广阔,如无人驾驶、量化金融、辅助医疗等。如果AI从围棋AI进化到不完美对称博弈系统,也就是能处理现实中更常见的不确定性问题时,想象空间非常巨大。”腾讯公司副总裁、AI Lab负责人姚星表示。

绝艺团队在赛后接受采访时称,在绝艺的研发过程中,如何评估棋力,以及存在哪些问题,是非常困难的。并且随着绝艺棋力提升,普通的棋手基本无法战胜的时候更难暴露其不足。因此,绝艺的研发过程中得益于超一流棋手的指导,对研发进度有非常大的帮助。

在参加 UEC 之前,“绝艺”曾先后使用多个ID,在腾讯围棋(野狐围棋)平台与业余和职业高手切磋,多次战胜中日韩三国一众顶尖棋手,成为腾讯围棋首个晋级“十段”的棋手。截至3月9日,“绝艺”对局数量达534盘,战绩是406胜128负,胜率76%,与柯洁、古力、常昊、范蕴若、范廷钰、朴廷桓等超过100位知名人类棋手有过交锋。“绝艺”团队称,“绝艺”与人类棋手不断交流,在对战中学习,一步步成长。这也是AI Lab对于绝艺的期待——希望它能与人类棋手积极互动,从而激发更多关注并传承围棋这一中国传统文化。

在棋类游戏之外,这些对决也将引发更多的思考——那些人们曾经以为人工智能不可能完成的脑力挑战,是否都将被一一打破?未来人类是否会被人工智能所取代?未来人工智能除了围棋还能做什么?

在百度董事长李彦宏看来,人工智能堪比工业革命。他今年在两会上的三个提案,全部聚焦在人工智能领域。其中包括用人工智能技术解决儿童走失的问题,用人工智能技术调交通信号灯,以及人工智能和各个行业的结合。目前,百度正在把人工智能重要的精力放在无人驾驶方面。

而马化腾称,腾讯 AI 要做的是更希望是能结合到自身的产品里面,让用户用起来产品发现越来越好用,或者说后台(包括信息安全方面)也可能需要用AI的技术,“这样的话你不用铺很多的客服去看这些数据,那这样你完全是用AI的技术来去做信息安全,我觉得也是更有效的。”

他还提到,在有一些更有趣的、未来感的一些AI上腾讯也有很多的团队做研发、尝试。“这方面我们还是很鼓励创新,甚至是同一个课题有多个小组同时在做,哪怕有一定的冗余度,我觉得都应该鼓励。我觉得这方面的投入都不会浪费。”

内容加载中