昨天我们刚报道了微软在GitHub上开源其深度学习(语音识别)工具包CNTK的消息,本文则继续深入讲述下它。该AI为微软Cortana个人助理和Skype Translator等服务所使用,作为一个框架,其发布于去年4月份,允许系统识别人类语音。除了演示过的Cortana和Skype之外,通过模拟人脑的功能和结构,它也能够用于高级的图片和视频服务。
微软首席语音科学家黄学东(图片来自微软)
CNTK最初是封闭且仅可用于非商业目的,但微软刚刚让自家的这一“大脑”向所有人开放,并且带来了“集体智能”(collective intelligence)这个新词汇。
微软希望自家技术能被其它企业和学术机构所利用,不过此前,Facebook和Baidu等企业也都作出了类似的决定。
此外,Google开源的TensorFlow框架也已于去年发布,并被用于该公司的搜索引擎和其它Android应用程序。
从规模上来说,微软的CNTK,相对于Google在开源人工智能框架的努力上又更进了一步,尤其是它允许同时利用多台服务器的性能。
据微软首席语音科学家黄学东所述,Google发布的更加有限,对于现实中的人工智能应用程序来说不太现实:“我们希望它不仅面向学术者,也能够让商业人工智能和深度学习的企业所使用”。
CNTK的另一优势是,很少有一个人工智能框架是兼容Windows的。与其它AI工具相比,它的效率显然要高得多。
它的缺点是当前仅支持C 机器专属语言,所以用起来可能有点麻烦。好消息是,微软计划添加对Python和C#的支持,前者在人工智能领域有着相当广泛的应用。
相关文章: