游客

“冷扑大师”暂时领先德扑大战 人类翻盘可能性低

游客 2017-04-07 09:19:59    200856 次浏览

来源:界面 刘燕秋

“冷扑大师”暂时领先德扑大战 人类翻盘可能性低文章配图

应该没有人会否认,过去一年,人工智能领域最重要的一件事就是AlphaGo和李世石之间的人机大战。AlphaGo不仅为全民科普,也吸引了更多的人和钱涌入这一行业。

现在,李开复似乎打算给国内的人工智能行业制造一些新话题,他的策略是引入母校CMU开发的德扑人工智能程序,将围棋人机大战升级为德扑人机大战。

2017年4月6日,德州扑克人机大战结束了首日的赛程,在上午的比赛中,人工智能“冷扑大师”暂时领先14145记分牌。

冷扑大师是基于卡内基梅隆大学(CMU)Tuomas Sandholm教授和博士生Noam Brown所开发的Libratus无限德州扑克人工智能系统。对战方“中国龙之队”则由2016年世界德州扑克大赛WSOP金手链冠军得主杜悦领军。战队成员中许朝军、张淮、童舟、朱亚希、王天建均为扑克玩家圈内熟知的顶级高手。

比赛于4月6日至10日举行,为期五天,总共要进行36000副手牌的比拼,获胜一方将获得200万元奖金。第一天上午的3600副手牌刚好是十分之一的赛程。龙之队总共输掉14145的筹码,相当于一副手牌的输赢量,因此整体来看,上午双方的较量几乎不相伯仲。

同AlphaGo对战人类棋手相比,为何冷扑大师在今天上午的比赛中没有呈现出压倒性的优势?在李开复看来,这和机器学习还没打开有关。他认为冷扑大师几乎没有输的可能。即使是参赛选手王天建,也坦言结果可能是“凶多吉少”。领队杜悦更是在赛前就曾预测,击败冷扑大师的概率不超过10%。而这10%的胜算来自两个方面,一是表演赛时间更短,运气成本在概率上会增加,二是团队成员均是德扑 计算机”双学位“,可以随时调整对战策略。

听上去如此悲观。历史上,第一代Libratus曾经败在人类手上,但局势很快便发生了逆转。今年1月,在美国匹兹堡的比赛中,冷扑大师战胜了四位顶级职业德扑选手,赢得176万美元

同围棋相比,扑克的游戏规则更像是在处理真实世界的问题。这是一种有关不确定性的游戏。玩家并不知道对手手中的牌,也不清楚会拿到什么牌,这个过程中同时掺杂着各式的诈和招数。

但Libratus背后并没有使用心理战的机制,它所依靠的仍然是大量的数学。Libratus也没有AlphaGo使用的深度学习技术,而是依赖于一种比较古典的线性规划,一种极其强调试错的方法。举例来说,AlphaGo是通过分析人类玩家的3000万棋谱来学习的,Libratus却是从零开始,通过自己跟自己玩大量的游戏进行学习。Libratus还利用了博弈论,通过平衡风险与收益来决定自己的下一步。

Liberatus使用了美国匹兹堡的超级计算中心来完成比赛,每做出一个决策大概需要5到10秒钟。如同人类选手在每场比赛后会聚在一起商讨后续的计划,每个夜晚,Libratus 也会使用这台超级计算机优化策略。

不断在人工智能领域发声的李开复是这次Libratus来华的发起人,但在他看来,胜负是基本注定的,这场比赛更重要的意义在于可以借机加快人工智能在中国的概念普及和实际应用。

关于Libratus的商业计划,卡内基梅隆大学计算机学院院长Andrew Moore表示,他自己最喜欢的商业应用是在企业交易或者是企业谈判领域,货物的供需或者货物的交易,可以用这种AI驱动的商业谈判算法来进行,人们甚至可以通过AI去摸清谈判对象的底线和谈判逻辑。

毫无疑问的是,AlphaGo战胜李世石确实在全球范围内催热了人工智能。根据Venture Scanner的统计,截至去年11月,2016年全球1485家人工智能公司融资总金额高达89亿美元。在中国,人们的热情尤甚。今年年初,斯坦福大学终身教授和人工智能实验室主任李飞飞来华,在演讲现场被团团围住,便是这种热情的一个注脚。

但热潮过后,AI 公司接下去要要拼的还是行业资源和扎入垂直行业的能力。今年两会上,科大讯飞的刘庆峰表示,“今年就是人工智能的分水岭,最大的分化就是看它在应用中的差别,忽悠概念的大潮马上就要褪去”。Andrew Moore在谈及AI技术在中国市场潜力时也表示,更看好的是特定垂直领域的解决方案,特别是能在实际生活或商业上被用到的场景,鼓励中国的创业者尽量设定特定垂直领域的一些应用发展。

内容加载中