科技巨头们正积极拥抱人工智能及语音识别技术,但构建一个语音识别系统的音源库需要庞大的资源,并非小型开发商或者个人开发商能够承受的。Mozilla 基金会正在酝酿一项名为 Common Voice 的众包式音源和识别库,该数据库将免费向三方测试开放,供那些需要在开发项目中应用语音识别(语音转文字)训练功能的开发商使用。
该项目的目标是收集超过一万小时以上的音频音源,包括各种口音并且预计在今年晚些时候渐进式开放。而现在每个人都能够在该网站贡献上传自己的音源,通过自然地朗读指定陈述句,或者判断听到的他人录音口音及语调是否准确。还有相关的 iOS 应用供移动设备用户直接上传语音音源。当然 Mozilla 对项目贡献者做了非常严格的隐私保护。