游客

小度声纹识别远超普通人类 1:1战平天音神童

游客 2017-01-16 10:38:28    201047 次浏览

1月13日晚,江苏卫视《最强大脑》第四季“人机大战”进入三番赛的第二轮,搭载“百度大脑”的 “小度”机器人挑战名人堂选手—— 11岁的“听音神童”孙亦廷,双方1:1打成平手.被称为“鬼才之眼”的水哥(王昱珩)宣布再度出山,将在下周的第三轮比赛中与“小度”在图像识别方面一决高下。

此前,在上一轮比赛中,百度大脑凭借在人工智能和人脸识别领域的深厚积累,以3:2险胜人类最强大脑的代表,“世界记忆大师”王峰。

相比上一轮比赛,本轮中双方选手准备得更充分,“想赢”的心情也更加直白。因盲听几十米高空坠落水球误差不超一米一战成名的孙亦廷,这期经过了周密的准备和训练,现场表示“我的耳朵(听力)更好了”。

小度声纹识别远超普通人类 1:1战平天音神童

而此次携小度出战的百度语音技术部总监高亮也表示,“我们已经把AI能够达到的最好的听觉的技术,放在小度身上了,它是否能赢过人类我们不清楚,但是它已经是人工智能技术(目前所能做到)最好的了。”

本轮的命题也更加刁钻,以至于嘉宾、名人堂选手一致在现场表示此题难度太大,“只能瞎蒙”。题目规则为:从“千里眼”到“顺风耳”,节目组将第二场比赛范围划定在“听”的领域,策划出高难度选题《不能说的秘密》,由周杰伦化身出题人,从21位性别相同、年龄相仿、声线极为相似的专业合唱团中,选出三位每个人读一句话,加密后成为断断续续的声音样本再交给小度和孙亦廷,要求他们从合唱声音中识别出三名线人的声音。

对此,高亮从技术角度解读说,“声纹识别对机器来说是一项‘高难度挑战’,尤其是本次比赛采用的大合唱形式能显著降低不同人的差异性,并且合唱的内容有长时间的语气词内容,更进一步增加了注册语音的混淆程度。而线人测试声音断断续续,特定说话人的一些发音习惯很大可能被损坏掉,也加大了说话人特征提取表征的难度。”

比赛过程也因此格外紧张。第一道题刚开始,“科学评审”Dr.魏(魏坤琳)就打断比赛指出:“人类选手要(被允许可以)反复听这段声音!”并解释:“人的感知记忆很短暂,听完第一段声音,第二段声音再进来是就会受干扰。”他的建议被迅速采纳,比赛规则改为人类选手可以重复听,小度只能听一次。

最终,共计三道题目的比赛中,第一道题人工智能“小度”和“最强耳朵”孙亦廷同时判断错误,且结果惊人的一致;第二位线人被小神童孙亦廷识别出,小度判断错误;第三道题孙亦廷判断错误,小度则力挽狂澜,成功识别出第三位线人,双方1:1打为平手。

赛后,孙亦廷对此结果表示满意,因为“战平了总比输了要好”。现场也爆出重磅消息,在大家的鼓舞下,曾在520杯水中挑选出指定样本的《最强大脑》神级人物 “水哥”王昱珩宣布,决定在下一场比赛迎战小度。

小度声纹识别远超普通人类 1:1战平天音神童

对于一胜一平的小度而言,下一轮比赛将成为“胜负手”,若战胜王昱珩,小度所代表的百度大脑将会进入《最强大脑》最终脑王的角逐,否则将遗憾退出。高亮对此表示,“小度作为中国人工智能的代表,实际上背后也有一批很出色的科学家,他们也很渴望能跟最顶尖的选手进行对决。”

对于“小度”一胜一平的领先态势,百度深度学习实验室主任林元庆此前表示,这次人机大战是以实战的方式来,来检验百度人工智能和人类差距。但是,打败人类并不是参赛的目的,而是希望在此过程中不断进步,演化出很好的技术来服务人类。

节目组表示,选择“小度”参与比赛并非简单比较它与最强大脑孰高孰低,对于人类选手来说胜负并不重要,全力以赴去比赛,尊重自己、尊重对手,尊重人工智能背后的科学家更重要,希望双方在下一场贡献出更加精彩的比赛。

内容加载中