骑猪兜风

AlphaGo逆转李世石:机器本性战胜人性弱点

骑猪兜风 2016-03-10 08:36:10    200769 次浏览

AlphaGo逆转李世石:机器本性战胜人性弱点

  雷建平 3 月 10 日报道

  3 月 10 日,人机世纪大战迎来第二场较量,这场较量注定会备受瞩目。

  在此前的 3 月 9 日,人机世纪大战第一场结果出乎大多数人的意料,谷歌人工智能系统 AlphaGo 竟然在局势不利的情况下,挑战世界围棋冠军李世石成功,李世石则投子认输。

  很多人认为李世石故意放水,李世石则在随后的发布会中表示,“比赛中有两件事让我吃惊,一个是 AlphaGo 开局下得非常好,第二个是在比赛过程中不断有一些令我想不到的下法。”

  李世石说,“我没想到过我会输。我觉得我一开始犯的那个失误一直伴随到了最后,成了我失利最主要的原因”。

  创新工场 CEO 李开复则在这场比赛棋至中盘时就点出李世石的问题:李世石在尝试新打法,这非常不明智。比较好的打法是按照经典标准,以过去专家打法来,会比铤而走险更稳当。

  围棋九段、中国国家队著名国手江铸久指出,从李世石布局阶段就能看出来,他今天在心理上一开始就有波动,因为他采取的是非正常的布局。这也说明 AlphaGo 这 5 个月进步很快。

  李世石败给 AlphaGo 的背后,是人性与机器的较量。分析称,真正让人感到害怕的不是 AlphaGo 的棋力,而是它的没有情绪、不知疲倦、沉着冷静。这与 AI 无关,是机器的本性。

  求稳让李世石犯下致命错误

  这场谷歌 AlphaGo 对抗世界围棋冠军李世石的较量,从一开始就像一场在刀锋上的比赛。

  开局之初,AlphaGo 与李世石的对攻就显得惊心动魄,一度 AlphaGo 还处于领先位置,不过,在“开战”2 个小时后,李世石的优势逐渐开始明显,AlphaGo 陷入到劣势。

  古力九段点评说,从今天来看,AlphaGo 围棋水平比欧洲冠军樊麾要强,已经具备职业强手的素质,但在细节方面刚好离专业差一点。AlphaGo 应该是处于业余六七段的水平。

  AlphaGo 最凶险的时候,古力九段和柯洁九段已做出预测,这一盘棋,AlphaGo 基本上输了,“如果是个人类选手,基本上已经可以投子认输。”

  在巨大的劣势中,AlphaGo 突然又开始抗争,最后反而越战越勇,后发而至,与李世石又形成僵持局面,甚至占有优势。李世石面临的局势又变得非常凶险。

  而赢面非常大的情况下,李世石过于求稳,反而被 AlphaGo 追上,且出现明显失误,损失三目棋。现场解说员表示,AlphaGo 与李世石这一番厮杀,他都受不了了。

AlphaGo逆转李世石:机器本性战胜人性弱点

  一直到下午 3 点 30 分,李世石投子认输。在这场长达 3 个半小时的对抗赛中,AlphaGo 赢得最终胜利,李世石情绪、体力、心理波动等人性弱点对棋局结果的影响不可低估。

  一位围棋界人士点评说,李世石并不输在棋力,而是输在获得优势以后的轻敌,以及之后所犯的错误。尽管 AlphaGo 也曾出现失误,但在李世石遭遇的失误面前这些失误可忽略不计。

  相比 AlphaGo,李世石更聪明、棋力更深厚,但 AlphaGo 的优点是,情绪控制更好,它不会紧张,不会嘚瑟,不会沮丧,也不会体力下降。AlphaGo 更像是一位棋力比他稍差的忍者。

  实际上,围棋手和围棋手之间的较量,围棋手与机器之间的较量有很大的不同。

  两个人下棋的时候,棋手常常会观察和琢磨对方情感和心理。对方是紧张了,害怕了,你在想象对方的同时,这种作用对方也会感到到,折射回来。但和机器下棋,这个就显得很别扭。

  更可怕的是,AlphaGo 有很强的学习能力,基本没套路可寻。欧洲围棋冠军樊麾曾对腾讯科技表示,面对机器就像面对一堵墙,所有感觉全部都被打了回来,机器却没有心态的波动。

  克服人性弱点是战胜 AlphaGo 的关键

  资料显示,AlphaGo 使用蒙特卡洛树搜索算法,借助值网络与策略网络这两种深度神经网络,通过值网络来评估大量选点,并通过策略网络选择落点。

  机器最初通过模仿人类玩家,尝试匹配职业棋手的棋局,一旦它达到了一定的熟练程度,它开始和自己对弈大量棋局,使用强化学习进一步改善它。

  作为一个大数据专家,陈利人认为,人类不可能不犯错,而机器不会犯错。棋局中说到的机器犯错,是人类理解的犯错,而这些选择,是机器精确计算后的结果。

  陈利人说,最后我们看到的局部战斗,机器的绝对优势发挥淋漓尽致。人类经常只能看势,模糊估算。但机器在小的搜索空间,完全可以精确计算,找出最优的选择。

  “机器下出的不符合通常人类认可的模式,给人类造成了很大的困扰。人类在没有模式可 follow 的情况下,尝试新的下法,出错(失算)的概率很大,也有可能造成心理的负担。”

  尽管李世石输掉了首场比赛,但此次人机世纪大战一共分为 5 场,还有 4 场,分别是 3 月 10 日、3 月 12 日、3 月 13 日和 3 月 15 日。依然有很多人对李世石获得胜利很有信心。

  资深研究员戴文渊认为,和 AlphaGo 对抗时人类需要注意几点:

  1,AlphaGo 所基于的人工智能技术,强项不在于推演,而是借鉴过去见过的局面。所以,如果要击败 AlphaGo,需要尽可能把局面导向历史上没人下过的棋。

  2,围棋的边角战斗靠计算,中空战斗靠感觉。既然感觉占优,那就一定要尽量把胜负手留在棋盘中间。靠做“势”取胜,而不是把战火引到边角实地。

  3,一旦进入到局部缠斗,尽早将局部肉搏战打完,不要留出大量小区域短兵相接的局面,保持局面尽可能大开大合。

  此外,需要格外小心的是,一定要克服自己人性的弱点。局面领先时,避免骄傲;落后时,避免气馁;胶着时,避免紧张。

  戴文渊认为,李世石如果能在后面几局注意控制自己的心魔,依然可以扳回不利的局面。

  古力九段认为,这盘棋在细微的地方机器跟人还是有区别,AlphaGo 要吃亏一些,但李世石也存在很大的失误,就是在战局的右边,当形势一片大好的时候,人出现了松懈。

  “由于前面有乐观心态,他连自己最擅长的拼搏都没有了,而是选择安乐的输棋,这让我们对他今天的发挥比较失望。这次失败也会对他敲了警钟,我对他第二场的发挥比较期待。”

  尽管输掉比赛,李世石在随后也表示,经过第一场比赛,觉得第二场比赛的胜负会是五五开。

  在这场谷歌 AlphaGo 对抗世界围棋冠军李世石之后,一场新的较量或许也在酝酿。第一场赛后,李世石的对手柯洁发微博表示,“就算阿法狗战胜了李世石,但它赢不了我。”

  尽管是 1997 年出身,但柯洁在 2015 年世界大赛已豪取三冠,与李世石的交往战绩是 8 胜 2 负。不久前刚结束的农心杯三国擂台赛上,柯洁作为主将还力克李世石助中国队捧杯。

  谷歌 AlphaGo 似乎也将目标标准了中国棋手,准备在挑战李世石后,再展开一场较量。AlphaGo 围棋创始人哈萨比斯称,希望 AlphaGo 能与中国的高水平棋手对弈,比如柯洁。

  “其实我觉得这次棋谁赢谁输不是最重要的。”李开复说,一旦 AlphaGo 达到专业二段的水平以后,打败人类只是迟早的事,这个时间点可能最快只要 6 个月到 2 年的时间就能到来。

内容加载中