凤凰科技讯(作者/王玄璇)4月10日, “冷扑大师V.S.中国龙之队——人机扑克巅峰表演赛”落下帷幕。经过五天赛事,冷扑大师最终以792,327总记分牌的战绩获胜,200万奖励归属冷扑大师。
五天下来冷扑大师累计赢得792,327记分牌数,平均22.0每百手损失大盲。
此次人机扑克大战巅峰表演赛的发起人、创新工场CEO、人工智能工程院院长李开复表示:“透过冷扑大师和龙之队表演赛的对战结果,人机对战基本没有悬念了,据闻AlphaGo近期即将来华和柯洁对战,其实已经不再具有科学意义了。”
围棋和德州扑克代表了AI处理人机对弈的两种信息模式——完美信息和不完美信息。在博弈论中,完美信息指后参与者可观察到前参与者的行为。不完美信息指参与者做选择的时候不知道其他参与者的选择。
冷扑大师背后是由卡内基梅隆大学Tuomas Sandholm教授发明的人工智能Libratus,和AlphaGo不同,Libratus不需要提前背会大量棋谱,也不局限于在公开的完美信息场景中进行运算,而是从零开始,基于扑克游戏规则针对游戏中对手劣势进行自我学习,并通过博弈论来衡量和选取最优策略。
AlphaGo也通过和自己下棋来学习,但在此之前会分析人类玩家的棋谱学习,再和自己下棋来提高棋艺。
在此次比赛和1月匹兹堡的两次德扑人机对战中,Libratus和冷扑大师在三个主要技术模块中都使用了新的算法:包括比赛前采用近于纳什均衡策略的计算(Nash Equilibrium strategies)、每手牌中运用终结解决方案(Endgame Solving)、以及根据对手能被识别和利用的漏洞,持续优化战略打得更为趋近平衡。
这也是冷扑大师在后程越来越凶悍,让人类玩家难以抵挡的原因之一。在五天的巅峰表演赛中,冷扑大师和中国龙之队双方共完成了36,000手牌,每天鏖战10个小时。
比赛首日中国龙之队与冷扑大师的积分差距为65,137记分牌,第二日人类落入低谷,差距347,565记分牌、第三日差距233,874记分牌、第四日人机大幅拉近为98,408记分牌、完赛日47,343记分牌,五天下来冷扑大师累计赢得792,327记分牌数,平均22.0每百手损失大盲。
积分差距
中国龙之队队长杜悦在谈到五天的比赛感想时表示,“人工智能在对战时不会受到情感、心理、体能等因素影响,且强大运算能力远超人类大脑,不得不承认冷扑大师很多手牌打得令人拍案叫绝”。
对此,创新工场李开复博士说,人工智能发展势不可挡。“我认为,未来的人工智能领域不再是几个小伙伴就可以打天下的时代了,而是需要顶尖的人工智能科学家、海量数据、强大的运算能力、以及清晰行业应用几大闭环。”
李开复表示,希望冷扑大师对战龙之队这场人工智能的里程碑事件将推动人们对于人工智能的认知,人机扑克对战中,我们看到了在尔虞我诈、概率不确定、非完美信息需要推理和情商的游戏里,机器一样可以获胜,而类似的场景在真实世界中比比皆是。人工智能已经不再只和AlphaGo对标,人工智能已从不完美信息的处理,进步到对不完美信息海量信息运算,并具备了推理和学习能力。
他强调,“我期待下一个更加高明的AI大师级应用登场,而我更愿意相信,这些应用会来自优秀的年轻创业者,而不是诸如BAT等的科技巨头黑洞”。