中國AI領跑全球！百度DuerOS揭祕：喚醒萬物/完全開放

今天的百度大招频频，除了公布阿波罗无人驾驶计划外，还带来全新的DuerOS，这个系统被誉为AI时代的安卓。

无人驾驶、AI是接下来百度重点发力的两个方向，当然他们在这个领域也已经深耕许久，所以今天这场开发者大会更多的是展示他们在这些领域的积累沉淀。

中国AI领跑全球！百度DuerOS揭秘：唤醒万物/完全开放

来重点说说这个DuerOS，百度度秘事业部总经理景鲲强调，这个系统就是人工智能时代的安卓系统，其优化了人们与设备之间的沟通。手机、电视、冰箱等任何设备，都可以搭载DuerOS，变成一个能“听懂”的设备。

为了支撑自家的DuerOS，百度还全资收购了目前顶级的人工智能创业公司KITT AI（全面免费向百度的合作伙伴赋能开放。），其在语音唤醒和自然语音交互技术积累颇丰，从今天发布会现场，KITT.AI CTO陈果果演示的成果来看，其识别率相当高，并且自主学习能力很强，比进入Snowboy的唤起词库新建唤起词“你好景鲲”后，接着只需要说三遍“你好景鲲”，即可完成唤起词的训练。

中国AI领跑全球！百度DuerOS揭秘：唤醒万物/完全开放

目前DuerOS的合作伙伴已经有多家，其包含了中信国安广视、小鱼在家、哈曼、美的、海尔、联想等，而景鲲则认为，唤醒万物的核心三要素是要做好听清、听懂、满足。听懂是人工智能时代用数据和技术解决的关键问题。“只有百度在中国市场是唯一具备听清、听懂、满足的实力”，Duros旨在打造一个开放赋能的生态系统，具体来说就是：

1、“听清”方面：百度的语音识别率做到了近场识别的准确率97%以上，但这些在AI时代还不够。在AI时代，技术要与场景相结合。我们希望把语音放到真正的场景里面去解决问题，研发了麦克风阵列、回声消除、语音唤醒、人像识别等技术。这些都是我们逐渐推进的世界先进技术，将被放到各种场景中实现用户听清的需求。

2、“听懂”方面：数据多、介入深是打造对话系统的必然条件，具备这两点才能做好一个真正可以对话的“听懂”系统。百度是具备数据量最大的公司。百度拥有亿级的多轮对话数据、十亿级的知识图谱数据。

“‘听懂’的目标，就是要FreeStyle，让用户最自然地跟设备进行交互，毫无拘束。”他现场演示了利用DuerOS的多轮交互过程，这种交互只有百度的技术才能驱动。通过连续发问：“找一找本地人气最火爆的家常菜”、“雍和宫附近有吗”、“第二家有什么推荐菜”、“有wifi吗”、“好停车吗”……多轮连续展开的对话，景鲲都得到了满意的答案。

3、听懂并满足“听一首某某的歌”这样的用户需求还不够，真正用户想要的是更自然、更复杂的需求，比如“我要听我手一杯品尝你的美这首歌”，比如“想听哥哥的歌”，只有把用户在真实场景中表达的复杂请求做好，才能真正做出一个真正听懂用户需求的产品。

此外，景鲲还介绍DuerOS将为开发者提供最容易上手的软硬件一体化解决方案，包括多样化的开发套件和完全开放的参考设计：

1、搭载树莓派，利用科胜讯技术的个人版。即刻申请就可以搭载一个个人可以对话的语音设备。

2、轻量版：把一元钱大小的芯片放在任何一个设备里面，设备就可以对话。

3、标准版：两麦、四麦、六麦、八麦的标准版都可以即可申请。

完整一体化的参考设计。如开放电路板设计、开放结构设计、开放麦克风阵列等等。手机、电视、冰箱等任何设备，都可以搭载DuerOS，变成一个能“听懂”的设备。

发布过程中，景鲲邀请来自度秘的百度工程师罗兴现场演示了“如何将百度DuerOS的能力接入搭载Alexa的Anker音箱”，展示了智能设备开放平台的便捷性。罗兴通过十七行代码，用1分钟的时间，让原本只会英文的音箱马上变得能听懂中国话。

中国AI领跑全球！百度DuerOS揭秘：唤醒万物/完全开放

中国AI领跑全球！百度DuerOS揭秘：唤醒万物/完全开放

相关推荐