未来,语音将极大程度代替键盘,成为我们与计算机交流的主要方式。事实上,随着近年来深度学习、大数据以及云计算在语音识别中的广泛应用,语音识别技术得到了长足的进展,东芝综合运用其先进的语音、图像识别技术并综合云计算服务,开发出能够助力人与人交流的人工智能(AI)技术RECAIUS。
东芝产业信息通信技术ICT解决方案公司负责RECAIUS项目研发的梅木秀雄介绍说:“为了实现人与AI安心、舒适、协调共存,AI需要具备能够捕捉人类感知和体验的判断。在语音识别方面,即便AI没有完全听清人们的语音,也能够从表情动作中给出恰当的应答,并实现一对一的简单会话,还可分辨多个会话组合,通过计算机算法形成文本。为此,东芝开发出的 RECAIUS 能够根据人的表情、声音和动作,综合判断把握具体意图和状况并进行适宜应答。”
相比一般的翻译软件,东芝的RECAIUS具备同声传译功能,其不仅可以翻译多国语言,而且即便是语句间没有间断的连续语音,RECAIUS也能自动判断适合翻译的单位,实现智能断句,然后逐句完成翻译。除了语音识别、交互、翻译等功能,东芝RECAIUS还开发了将可视文字信息即时翻译成其他语言的技术。想象一下,人们出国旅行,来到一家以美味著称的餐馆,却往往被菜单上的异国文字搞得一头雾水,如果菜单上又没有图片,根本不知道该如何点菜,而东芝RECAIUS可帮你摆脱这个困境,拿起智能手机对准菜单进行拍摄,它可以瞬间把菜单上的菜名翻译成母语。
人们用相机拍摄图像时,照片上不只有文字,还有背景、图案等其他信息,为了能够清晰地从复杂图像中辨别出文字信息,东芝开发出独有的图像特征提取技术,可以精准检测到文字。而这一技术对国外的街景图像很有效果,RECAIUS可以轻松地从街景的图像中识别其中的字符串,判断语言属性并将字符翻译成使用者需要的语言文字显示在屏幕上。东芝表示,该技术未来或将与AR眼镜配合,使用者即使身在异国他乡,也能够将眼前充斥着的外语转换成母语。