谷歌翻譯研發科學家高勤：利用機器學習消除語言障礙

谷歌翻译研发科学家高勤：利用机器学习消除语言障碍

7 月 11 日上午，2017（第 16 届）中国互联网大会在北京国家会议中心开幕。谷歌翻译研发科学家高勤在会上进行了演讲并总结了谷歌翻译最近一年取得的进展，着重对神经网络机器翻译技术作了深度的解析。

高勤指出，经过 11 年的发展，谷歌翻译已经成为一个全球性的产品，月度活跃用户超过 10 亿人次，其中 95% 来自于美国以外地区。翻译质量一直是谷歌翻译所关注的焦点，最近一年以来，因为使用了神经网络机器翻译技术，谷歌翻译的质量有了显著的提升。

神经网络相对于传统技术是一种革命性的改变。基于短语的统计机器翻译是拼图过程，通过对短语对的排列和组合，尝试找出较好的翻译选项，但整个决策过程是离散的、这个决策的信息也都是局部的。神经网络机器学习反其道而行之，使整个决策过程既是连续的也是全局的。

神经网络机器翻译相对传统技术的巨大优势，对于词根距离非常长的英文单词来说，传统机器翻译技术和难解决。英语复杂程序结构带来了很多调序以及省略，如果不能够利用整个云语言句子全局信息，就可能会得到一种不连续、不自然、不准确的结果。而神经网络机器翻译在这两方面都有了长足进步。

神经网络虽然拥有强大的表达能力，但也需要极大的计算量。谷歌张量处理器的诞生解决了这一问题，也使得提供快速的翻译服务成为可能。

高勤最后提到，虽然神经网络机器被反复提及和研究，但这并不代表着神经网络机器翻译已经非常成熟，事实上我们对神经网络机器翻译的认识仍然非常肤浅。下一步，我们将继续致力于改进数字、日期、姓名、品牌以及不常见短语翻译，同时进一步研究新的模型结构与训练方法。

谷歌翻译研发科学家高勤：利用机器学习消除语言障碍