谷歌自2012年以來已把語音識別詞錯率降低逾30%

据科技博客VentureBeat报道，谷歌高级研究员杰夫·迪恩(Jeff Dean)周三在人工智能前沿峰会(AI Frontiers)上表示，自2012年以来，谷歌已经把语音识别的词错率(WER)降低了30%以上。词错率指的是谷歌将一个词语从语音转录成为文字时的错误率。迪恩称，谷歌已经把词错率降低了30%以上。谷歌发言人证实了这一数据。

谷歌自2012年以来已把语音识别词错率降低逾30%

迪恩称，词错率的下降得益于神经网络的使用，后者是谷歌和其他公司在深度学习中使用的一种系统。研究人员使用大量数据对神经网络进行训练，例如语音片段，然后让他们对新数据作出推断。谷歌在2012年首次将神经网络用于语音识别中，当时正值“果冻豆”Android系统发布。

谷歌并不是经常讨论公司在语音识别技术上取得的进展，该技术影响着越来越多的谷歌产品，从Google Home智能音箱到Gboard输入法。但是在2015年，谷歌CEO桑德加·皮查伊(Sundar Pichai)曾表示，谷歌的语音识别词错率为8%。

苹果Siri资深总监亚历克斯·阿赛洛(Alex Acero)在去年8月称，Siri在所有语言中的错误率降低了两倍，许多情况下超过两倍。微软则在去年9月份表示，研究人员已经将词错率降至6.3%。

谷歌自2012年以来已把语音识别词错率降低逾30%

相关推荐