张力平
人工智能、大数据、云计算、物联网已成为继互联网、移动互联网之后的新热点。在相关信息通信技术的驱动下,人工智能新算法、新技术、新体验层出不穷,图像识别、语音识别、翻译、医疗健康乃至机器人等一大批人工智能应用应运而生。人们在惊叹这些新突破与新进步之余,更坚信人工智能是未来科技的发展基础,对人工智能的未来发展遐想联翩。
语言是人类特有的财富,是人类最重要的思维工具和交际工具。然而,鉴于人类语言的多样性和复杂性,作为人类社会中一种重要社会现象的语言也是人类了解世界及相互了解的障碍。打破因不同语言而产生的隔阂,顺畅地开展跨地域的人际交流、沟通是人类的美好梦想。在“地球村”越来越小的当下,国际交往日益频繁,人们对翻译(尤其是优质翻译)的需求越来越强烈。
与此同时,翻译也正在被科技颠覆。随着计算机等信息技术的不断发展,机器翻译技术已有长足进步,从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译,各种各样的翻译软件纷纷推出,为人们提供实时、便捷的翻译服务。在某些特殊用途上,机器翻译已经做得相当不错了。当然,目前的机器翻译大多是“纯翻译”,不仅词库不完善,也因为“隔行如隔山”、俚语、俗语、网络流行语等原因无法从多个可能的词义中准确地挑选出最贴切的一个,而且不懂语法、修辞、逻辑等方面的灵活应用。机器翻译的结果虽然不算精到,与好的人工翻译相差甚远,在实用性方面也不靠谱,但还是可以作为参考的。人们可以通过“连猜带蒙”,基本读懂“翻译”结果。如果是临时性的翻译或是对“信达雅”的要求不高,但要求快速,翻译内容也相对比较简单,文字描述比较好理解的翻译内容,目前的机器翻译基本可以搞定。当然,水平有限的机器翻译也经常会闹出笑话。在脱离特定语境的情况下更容易“出状况”,甚至“谬以千里”。要精确翻译诗歌、小说等内容,更是难上加难。
人工智能的发展推动了机器翻译的进步。引入深度学习技术的机器翻译软件,将基于神经网络进行翻译,通过借助海量计算机模拟的神经元,模仿人脑“理解语言,生成译文”。人工智能翻译先将翻译稿画面中的背景和文字分离。卷积神经网络使计算机能够识别同色的不同像素点,在模糊、脏乱的背景中准确识别出字符。随后,通过深度学习技术,将字符拼写成单词。最终,计算机会利用模糊查找技术去查词典,翻译出已识别的单词。人工智能翻译将大幅提升翻译的准确度,甚至有望达到人工翻译的水准,达致“译文流畅,符合语法规范,易于理解”的基本目标。而移动终端的“即时视觉翻译”通过摄像头即时取词翻译,利用增强现实技术把翻译后的文字原封不动地呈现在原来文字的位置,则相当于人工同声传译。有意思的是,具有深度学习能力的人工智能翻译软件,并不是一开始就具备强大的翻译能力,而是像刚出生的婴儿一样通过学习大量双语对照的句子,逐渐提升翻译水平。由于人工智能翻译目前还存在各种缺陷,为了弥补其不足,许多翻译公司正在尝试人工智能翻译 人工翻译的新模式,由人工智能先完成最基本的翻译,然后由人工翻译对人工智能翻译的差错进行更正,并对翻译后文本的文学性和专业性做进一步修订,以争取更高的效率,同时确保质量。人工智能翻译也会参与“翻译完善”这一过程。通过深度学习,计算机将基于人工翻译修订后的结果学到准确的词语表达以及人类的语言习惯,从而提升其翻译能力,以便今后给人们带来更加自然的翻译体验。计算机也会对人工翻译的结果进行追踪,帮助译者避免低级错误。人工智能翻译和人工翻译由此形成良性循环。人工智能还能了解不同译者具备的专业性。通过对这类数据的收集和分析,人工智能可以向不同译者分配他们擅长的翻译内容。
与机器下围棋一样,机器翻译一直被公认为是人工智能领域最难的课题。让机器理解语言,进而实现不同语言之间的翻译,不仅是几代科学家孜孜以求的技术梦想,也寄托着普罗大众对人类自由沟通交流的美好愿望。人工智能正在迅速追赶科幻畅想,“机器翻译”时代终将到来。求于至精,臻于至善。随着人工智能翻译软件的学习不断深入,人工智能翻译不仅能在实时性方面胜过人工翻译,而且在准确性方面也不输人工翻译,甚至在流畅度、文学性乃至语言美感等方面也会逐渐补强,还能玩一把“娱乐性”,用发言者的声音和语调把翻译的结果讲出来……