体育讯 昨晚,Master身份之谜揭晓,它就是AlphaGo的升级版本。不过有媒体报道说Master是没有学过人类棋谱的版本,此事经与AlphaGo团队确认,这次下棋的程序就是去年3月人机大战的升级版本,还是有人类棋谱学习的。很多网友好奇的两个人相同工智能对阵谁能赢,结论是“运气”好的一方赢。
Master是AlphaGo升级版,有人类棋谱的基因
有媒体报道“Master”的更可怕之处在于,没有人类棋谱的学习,完全是人工智能通过自我对弈,深度学习,强化学习完成的版本。但经过与AlphaGo团队的确认,这次的版本是去年3月与李世石人机大战的AlphaGo升级版,还是有人类棋谱学习的人工智能程序。公测结束之后,DeepMind发布的公告也隐约提到了这一点。
此前新浪网的一则关于“Master”身份的猜测调查,提到了此前DeepMind公司创始人哈萨比斯在一次采访中透露,他们正在尝试训练一个没有学习过人类棋谱的人工智能,这个AI和学习过人类棋谱的AlphaGo的对阵,令人期待。
这个对抗确实令人期待,因为我们有可能看到人工智能角度与人类角度看待同一事物的不同。我们就这个“没有学习过人类棋谱的AlphaGo开发的如何”的问题也去询问AlphaGo团队,但并未得到回应。其实从头到尾AlphaGo团队面对提问,只有两种反应,一是实话实话,二是暂时还不能说的实话就先不说。
无论如何围棋人工智能这部科技“大片”的序幕才刚刚拉开,期待后续的精彩。
两个同样的AlphaGo对阵会怎样?
这次的60盘30秒的快棋对局,远远没有逼出“Master”,或者说新版AlphaGo的极限。很多网友都很好奇如果两个同样的“AlphaGo”对阵会怎么样,谁能赢。有的人甚至担心两个“AlphaGo”因为都下出了最佳招法,而互相影响,进而死机……
首先要明确个事情,那就是围棋的变化是近乎无限的。AlphaGo虽然每走一手棋后会评判自己的胜率,这个胜率也是他根据自己计算到的变化图,通过“估值网络”得出的。而这些对人类来说海量的变化图是不均匀分布的,有些变化AlphaGo甲是算不到的,有些变化AlphaGo乙忽略掉的。
李世石与AlphaGo人机大战第四局,就是因为李世石走出了一步在当时AlphaGo计算之外的“神之一手”,令AlphaGo在当时比赛的用时策略下“计算力”不足,出现程序BUG,继而崩盘。即使是计算能力强大的人工智能,在近乎无限的围棋盘上,也肯定会有“漏算”的情况。
所以两个相同的的人工智能对战的话,将发挥出接近各自的极限水平,下出非常精彩的棋谱。最后“运气”好的一方会取胜,最严重的漏算发生在对手身上。也许正是因为人工智能可以这样一直全力左右互搏,自我印证,才会在围棋真理的道理上越走越远吧。(文玄)