游客

德扑人机大战第三日现场:选手装怂玩防守反击胜AI

游客 2017-04-09 12:42:44    201024 次浏览
德扑人机大战第三日现场:选手装怂玩防守反击胜AI龙之队全体队员和Tuomas Sandholm教授

新浪科技李根 发自海南

人族还是输了,但龙之队更兴奋了。

在21:15的海南比赛现场,龙之队显得比往常更加兴奋。许朝军的声音回荡了好几遍,“第一次,历史性第一次,同时有两人战胜了AI。”

4月8日,德扑人机大战来到关键性的第三日,经过10小时比赛,龙之队以233874记分牌落后于冷扑大师,但劣势缩窄。

上半场比赛,冷扑大师在意料之中获胜,领先173936记分牌。下半场比赛,龙之队触底反弹,失利大幅收窄至59938记分牌,第三日,冷扑大师领先233874记分牌。三天的比赛冷扑大师共领先646576记分牌。

人族还有赢的可能,即便体力上的挑战已经开始了,在现场,红牛的消耗量是前两日的好几倍,咖啡和茶等提神的饮品也消耗得更快更多。

但这并不是人族选手兴奋的主要原因,更加利好的消息是:冷扑大师的法门似乎被找到了。

德扑人机大战第三日现场:选手装怂玩防守反击胜AI龙之队队员童舟在比赛中

龙之队队员童舟是第三日比赛表现最抢眼的选手,不仅因为他顺利在个人比拼中击败了冷扑大师,而且他找到的规律正在发挥作用。

童舟的方式是:装怂、示弱,然后防守反击。

在前两日的比赛中,龙之队的策略更显得主动,但发现这样的风格在机器那里几乎占不到便宜,而且还导致第二日输得更多。于是在第三日,龙之队主动调整了策略,他们发现如果在冷扑大师面前装怂示弱,可能会扰乱冷扑大师的步伐,并且有可能抓住运气的机会趁势防守反击。

童舟在上午场微输,但他认为规律正在起作用,于是下午厮杀过后,他宣布自己“水上”——即赢得了胜利。

远道而来的Tuomas Sandholm就此接受了新浪科技专访,他表示“装怂”确实是一种策略,但必须要说明的是,这种策略只能保证人类少输,并不能保证人一定赢。

然而龙之队还是有希望的,因为运气正在站在人类一边。

德扑人机大战第三日现场:选手装怂玩防守反击胜AI龙之队女将朱亚希在比赛中

第三日比赛中,多位队员运气普遍不错,比如龙之队队长杜悦上午在一手中底牌拿到AK,其后公牌在一张6后竟然连续发出了3张A,于是汇集4张A后有了金刚里最大的一手。

概率来讲,冷扑大师手里的牌很难比杜悦更大了,剩下的打法,就是要顺势引蛇出洞,让冷扑大师 ALL IN。

但机器还是厉害,在杜悦800加注和ALL IN后,冷扑大师选择了弃牌,原本想全吃冷扑的杜大师,只好大叫一声“果然奸诈”。

还是难啊。即便有的运气助阵,但机器就算在这样的情况下,也能保证自己少输。而一旦运气来到冷扑大师这边,人族的处境就可能要难太多——因为机器也在不断循循善诱你All in,而且机器成功的概率要大得多。

然而,如果换个视角看这种现象,可能会让整个事情变得更明亮一些。比如龙之队美女选手朱亚希,就认为这几天在冷扑大师的交战中获得了提升,冷扑大师的策略和方式,会让你也挑战自己的打法,并且不断总结提升。她说这是之前打比赛很难获得的体验。

或许是时候换种角度看人机大战了,输赢只是结果,但不承载更多的意义,人机合一可能是未来人族与AI共处的方式一种。

德扑人机大战第三日现场:选手装怂玩防守反击胜AITuomas Sandholm教授接受新浪科技前方记者采访

Tuomas Sandholm教授则更加明确,当现场有媒体以“competition(竞赛)”向他提问时,他马上纠正称这是“exhibition(活动)”,不是competition。

Tuomas Sandholm教授来回在现场走动,不时悄声驻足在某个选手背后观看冷扑大师的应对——整个画面看起来像一个工程师团队在测试产品。

补充个小花絮吧,Tuomas Sandholm教授确实称得上工程师,而且该方面的能力显赫不已。说个中国用户比较熟悉的案例吧,公司的市值在2008年到2010年上涨5倍突破500亿美元,重要的变革在于搜索竞价系统的重新设计和完善,而当时任职设计顾问的人,正是Tuomas Sandholm教授。

至少在那两年里,Tuomas Sandholm教授让百度在竞价系统技术上有了追赶Google的态势。而其后Tuomas Sandholm教授把这种算法和模型,一直专研精进,以至于有了现在的“冷扑大师”。

内容加载中