语音记录,是记者、编辑、作家等文字工作者们常用的记录方式。但是,对于记录者来说,语音并不方便后期的整理、分享和追溯,这也导致听语音记录的过程耗时耗力,影响信息的沟通。近日,搜狗推出语音实时变文字的速记工具“搜狗听写”,解决会议、采访、写作等场景下长语音内容转写难题。
搜狗语音交互技术中心总经理 王砚峰
为了保证在各种复杂场景下都能精准转写,搜狗听写采用了大量的前沿技术。在转写方面,搜狗听写使用了搜狗知音独家研发的长时语音转写技术,并与业内领先的端到端深度神经网络技术深度整合,使得语音识别准确率保持在较高水平。据了解,搜狗听写的功能相当强大,可以支持写文章、采访录音、会议记录、笔记整理 、日常记事等场景,帮助用户实现高效记录和信息输入。
针对不同场景和需求,搜狗听写可以支持“听写”和“转写”两种模式。在“听写”模式下,录音的同时即可实时给出识别结果,话音落文字出,几乎没有时间差;而“转写”模式下则可以离线录音,录音完成后一次性获取文字结果。同时,为了提高文字整理效率,搜狗听写还贴心的加入了边听边改、无线标重点、多端同步、信息分享等人性化功能,大幅度提升记录效率,让文字编辑更轻松。此外,在针对图书馆、咖啡厅等不便于大声说话而又有使用语音的场景,搜狗听写提供耳语识别技术,在人的说话音量低至30分贝时,依然可以准确识别。
搜狗公司语音交互技术中心总经理王砚峰表示,搜狗听写作为一款多场景的语音听写工具,其产品的关键在于语音识别准确率,而通过大规模的优质语音训练数据和深度学习的技术能力积累,搜狗也将这种语音识别的技术优势转化到了更多的适用场景中。
目前,搜狗已经建立了强大的语音自研团队,拥有互联网规模最大的语音数据。每天超过2.6亿次的语音请求,为搜狗智能语音系统提供了海量的真实语料数据,使得机器不断学习,识别准确率越来越高,可应用的场景也越来越广泛,让人工智能更“接地气”,已经成为搜狗在人工智能领域的独特标志。