1 月 15 日,百度创始人、董事长兼 CEO 李彦宏参加极客公园,与极客公园创始人张鹏对话,就百度的人工智能战略话题,进行了讨论和分享。
最近,百度度秘参加最强大脑节目,与人类选手进行智力竞赛,对于度秘的表现,李彦宏表示,大多数人都觉得小度机器人一定会赢,但其实真的不那么容易。
“机器人在模仿人的很多能力方面还是有很多工作要做。第二局打平之后,我们很多工程师难过得都哭了,他们下了很多工夫。”
李彦宏介绍,百度为了准备度秘背后的人工智能,学习了两亿张人工智能的图片,其实一个人一生都看不到 2 亿人。
“但是计算机利用这个特长可以处理大数据,迅速处理很多很多数据,可以在不同的人脸当中找到一些共性的东西。越说不清楚的东西是机器不擅长,是人擅长的。”
为什么要发展人工智能?李彦宏的回答是,有一天机器学会了人能力的时候,他永远不可能疲倦,要处理比人多得多的信息,逐步逐步就可以做得比人要好。至少在某些领域可以比人做得要好很多。
“AI 会影响人类社会的方方面面,从行业的角度来讲可以影响金融、汽车、房产、电子设备,可以影响几乎每一个我们都能够想到的行业。从不同的消费者来讲,他可以影响很多消费者,从企业的角度来讲也可以影响很多的企业。”
在人工智能时代,极客是否还有存在的意义和获得发展的机会?李彦宏认为,AI 时代对极客而言是最好的时代,人工智能对极客而言意味着巨大的机会,这个机会可能会超过移动互联网带来的机会。
“AI 处在技术井喷的阶段,极客在我们看来是在新技术领域是对技术演进最敏感的人,他们也是最愿意尝试新东西的人。我们的极客如果找到自己感兴趣、擅长的领域去发掘这些机会,我觉得比移动互联网时代,PC 互联网时代的机会都要多得多。”
另外李彦宏认为,确立人工智能为中心的战略,并不影响百度的使命,李彦宏表示,“百度的使命从成立到现在我们没有变过,就是让人们最平等、便捷的获取信息,找到所求。搜索引擎本身也在进一快速的演进,早期都是关键词的匹配,到人工智能时代很多信息输入都是语音输入、图像输入,语音和图像的检索行为在百度过去一年当中占比一年乘以2。”
最后李彦宏还透露,自己并没有变成一个到处去演讲的人,大部分时间都是待在公司里面开会,进行内部沟通和推进,最主要的时间和精力用来找人才。
以下为对话实录:
张鹏:我们正在讲我们俩今天要有一个新的变化,新的玩法,这个玩法就是我们准备不这么正经的坐在沙发上,准备换一个方式。就这么聊,为什么这么聊,因为咱们今天开启的话题特别有新闻性,我知道就在不久前,百度自己的人工智能、度秘的一场人机大战好像赢了。
李彦宏:一胜一平。
张鹏:你觉得后面结果怎么样?能赢吗?
李彦宏:我觉得可能绝大多数人都觉得没悬念,小度机器人一定会赢的,但是真的不那么容易,机器人在模仿人的很多能力方面还是有很多工作要做。第二局打平之后,我们很多工程师难过得都哭了,他们下了很多工夫。
张鹏:就是很有可能赢?
李彦宏:对,但是也很有可能会输。这是机器人一个过程,早期机器人记忆、存储的能力是无人可以匹及的。我们一步一步在向人的方向努力。
张鹏:这个挑战其实是挺不一样的。如果说当时一开始我们看到的人工智能,大家看到的是他在一些计算能力上对人的超越,但是这些超越有的时候在不同领域体现出的难度是不一样的?
李彦宏:对。
张鹏:我看到人认脸。对人来讲人认脸应该是挺简单的,不应该是挺大的问题。为什么这件事很复杂,让人这么努力只到这个状况?
李彦宏:这是人相对来说,天生就觉得很自然的事情,但是对计算机来说却是没有标准答案的事情。计算机的规则越清楚,越是能够有限可能性的情况下所有的东西都试一遍,有一个标准答案,它可以做得很漂亮,但是如果说这个东西像什么,大概是什么,越模糊的东西人觉得很自然,甚至要求降低了,但是对于计算机来说这个要求很高的,什么叫像他不知道,计算机只知道零和一,让计算机知道这个人长得跟那个人很像,这个是有难度的。
我们为了准备度秘背后这套人工智能的东西,他们学习了两亿张人工智能的图片。其实一个人一生都看不到 2 亿人。但是计算机利用这个特长,我可以处理大数据,迅速处理很多很多数据,可以在不同的人脸当中找到一些共性的东西。这样才能相对来说有一定的信心说,我觉得这两个像,这两个应该差不多,这种越模糊,越说不清楚的东西是机器不擅长,是人擅长的。
但是我们为什么在这个方向上努力呢?有一天机器学会了人能力的时候,他永远不可能疲倦,要处理比人多得多的信息,逐步逐步就可以做得比人要好。至少在某些领域可以比人做得要好很多。
张鹏:这件事其实里面涉及到一个问题,你发现人对有些东西无法解释模糊的概念,比如说我不可能识别一亿张脸就可以有认脸的能力。但是机器无法建立,有的时候机器有它优势的地方,比如说我们在下棋这个层面。
李彦宏:这是规则清晰,它只要找到怎么有效的方法去找下一步怎么走之类的。
张鹏:输赢是明确的。
李彦宏:对。
张鹏:但是人算不过来一下一万次,但是认脸就没有明确的。
李彦宏:你说不清楚。
张鹏:这个是很有挑战的。
李彦宏:对。
张鹏:因为我比较了解这些事,我听到了传闻,还有一些图片,我们看看今年李彦宏参与了一件什么事。食物链顶端的人贝尔邀请你参与了越野千里。
李彦宏:是四川阿坝州爬雪山过草地。
张鹏:这个是有拍摄的?
李彦宏:对。基本上都是老外拍摄,中国人不让靠近。
张鹏:你当时什么感觉?因为这件事我们都有没有经验。
李彦宏:我一开始还是挺期待的。因为我这个人做互联网总是喜欢变化和新东西,从来没有经历过这样一个在荒野见到不一样的东西,我非常期待。但是整个过程又很辛苦,中间甚至有一些后悔。
我说这种话,我几乎这一生从来不后悔,这次做的过程当中还是觉得干嘛自己要给自己找这种罪受。
张鹏:为什么?你当时想去是因为什么?
李彦宏:想去就是因为没有经历过,我想尝试一下,喜欢新东西,各种各样的。我觉得任何一个企业家或者创业者在心底里头都有这样的冲动,如果是没见过,如果这里有风险,或者别人没尝试过的东西我想看看。
张鹏:这点在当时是驱动你参与了一个这样的事情,但是真进去之后发现其实水挺深的。
李彦宏:比想象得要难受。
张鹏:有吃虫子吗?
李彦宏:到时候看节目。
张鹏:感觉应该是相当相当酷的感觉。这块我想顺便提这么一个问题,我觉得面对挑战这件事,你进去以后虽然是以好奇心进入,但是进去之后就是一个重大的挑战。心里甭管是不是想退也退不了的,就得往前走。
把这件事转到商业上也是这样,百度每年都来极客公园大会,你之前谈到 AI、深度学习,已经是三四年前的事情了,远远没有今年这么热。今年这么热,这个行业里面已经几乎没有一家公司不谈 AI 了。
李彦宏:2013 年 3 月份我们宣布成立全球首个 AI 实验室,当时讲我们要吸引全球最优秀的人工智能科学家来跟我们一起对未来的探索。现在四年过去了,我自己也确实认为我们的确吸引了一批非常非常优秀的人工智能方面的专家和工程师。我们在做的一些事情主要分为这么几个方面,比如语音识别、图像的识别,自然语言的理解,用户画像等等这些东西。我们也开源了深度学习的源代码,反映还不错,整个运算的速度还不错,可以使用大规模的集群计算。
语音识别的能力在安静环境下达到 97%,是超越正常人的水平的个。图像识别进步也非常快,在百度贴吧里面非常活跃,有植物班。
张鹏:我经常看到你出没。
李彦宏:除了我之外还有一个人特别活跃,度秘。经常有人拍几张照片说这植物我以前没见过,这叫什么,或者朋友送我一盆花我也不知道是什么,有人给我指点指点吗?最先回答的就是度秘,这个东西叫做什么,原产地是什么。下面人会说谢谢,接着他又跟你调侃。很多人过一会才能识别出来,我怎么跟一个机器人说话啊。
机器人的特点很明显,你说一句话,它马上就回,秒回,立刻回。人是没有那么快的反应,这样能看出来是机器。
但是它也会错,有人问一个什么东西,它会回答错。在不一定对的环境进去人容易接受,在吧里面说什么都有,人说话也不一定保证对,这种情况接受程度也很高,正好像对于度秘这样的机器人又是一个很好学习的过程。如果我错了,你告诉我对的是什么,这样我慢慢就越来越聪明。
张鹏:有没有可能这种东西不光在植物吧?
李彦宏:其实很多地方已经在弄了,我们想把这个东西开放。比如说你喜欢的是狗,你可以训练度秘让它学习宠物狗。
张鹏:我可以在做宠物服务社区里面也有一个隐藏的机器人其实是能够告诉大家这个狗是什么种,是不是纯种。未来真的有可能有这样的状况存在。
李彦宏:我认为未来已来,电影吧里面也有度秘,比如说你告诉我这是什么电影,你给我推荐一个什么电影。它已经在若干个领域已经学的人模狗样了。贴吧有 1000 多万个,每个领域都可以无限的细分下去,每个领域我们都可以把度秘训练成那个领域的专家。这个需要一个过程,也是需要大家一起努力,这个我觉得是很有意思,很神奇的。
如果 1000 万个吧它都是专家,你觉得这是什么样的人。
张鹏:这个挺起来挺兴奋的。它不像我们现在下棋赢了一个谁,打牌赢了一个谁。你身边现在成长了一个知识比你多,学习能力比你强的人。
别的家也在做 AI,AI 是不是有一个循序渐进的过程,什么时候才能在一个应用里面有隐藏的力量能够起到这样的作用,也在学习,未来也可能有服务,这个过程是不是很长的过程?会不会把 AI 整合到自己的业务里面获得这种能力呢?
李彦宏:这是一个很大的产业,AI 会影响人类社会的方方面面,从行业的角度来讲可以影响金融、汽车、房产、电子设备,可以影响几乎每一个我们都能够想到的行业。从不同的消费者来讲,他可以影响很多消费者,从企业的角度来讲也可以影响很多的企业。
所以我们在几乎每一个领域认真看下去都可以看到很多很多这个领域跟 AI 的结合的地方。这个就是为什么越来越多人进入 AI 这个领域的时候我感到不是威胁而是兴奋呢?是因为大家相互激发,最后会有越来越多东西出来,最后我们都会变成一个受益者。如果用风口论来讲,你是站在风口上,不管有多少人站在风口上,总比你不在风口上好吧。
张鹏:这一条线上这个风足够大,这个才是你的感觉。按刚才讲,百度已经往前运行了很长时间,甚至在很多领域都已经有了。
李彦宏:我们不是想跟别人公司竞争,我们是想提供基础的能力,我们是希望提供这些能力到各个行业去,各种各样的公司让他们来用,包括度秘自然语言对话的能力。我们也希望跟所有的公司去合作,这次在 CES 我们跟小鱼在家就达成一种合作。
张鹏:他相当于一个陪伴机器人。
李彦宏:他搭载度秘的能力跟你对话,这种能力可以在家庭的场景用,也可以在贴吧的场景用。也可以在其他场景用,我们希望把这种场景开放出来,八仙过海,各显其能。
张鹏:他其实就是一个能力,不像原来,有自己的智慧,有自己的思想,甚至有不能叫做灵魂,至少他不像原来是一个机器编程的东西。
李彦宏:它会更加的智能也会更加的用户,因为它用自然的语言跟你对话。过去我们人类发明计算机之后,人一直在学机器的语言。我学一个C语言,学一个 java 的语言,以后是机器学人。这个是多神奇的东西,我跟桌子、椅子交互的时候说的是人话,这是很有意思的东西。
张鹏:机器应该能听懂我们说的东西,应该有趣,有趣其实在下一个阶段应该是很重要的一点。我们有太多的东西还不能用,在不同用的状况下我们就先把它用起来。再下一步我们有用了之后,希望它能够更好用,极致就是希望这件事有趣。
我们刚才聊到对整个商业世界未来百度可能会做一些赋能,你们把 AI 的力量八仙过海,各显神通。但是在实践的领域你们会使用哪些呢?比如说小鱼在家,AI 在所有的领域会这样吗?
李彦宏:会是这样。把它串起来看就认为它是一个必然,我们认为在 PC 时代,大家跟机器人交互就认为是键盘。我们一开始接触触摸屏觉得不精确,不好用,你让三岁孩子学键盘不太好用,但是触摸屏好学。触摸屏往下学是什么?不是触摸屏,是自然的语言。这是最最自然的东西,这样的东西我刚才讲在任何一个领域都可以起到非常不一样的这种作用。
张鹏:所以你看 CES 上咱们说汽车,自动驾驶,好像就是人工智能起来,把自动驾驶重新造车。
李彦宏:无人驾驶当然是需要计算机的视觉的能力,看到这是障碍物,这是人,这是轨道线,这是红绿灯,它要识别所有的东西。当你是无人驾驶,你要进到这个车里,你要告诉它去哪,这是需要自然对话的。这东西往后一看都是人工智能的东西。
张鹏:人工智能成为新的元素有可能要把这个世界重新制造一遍。
李彦宏:这只是一个产业,医疗行业我也比较了解。我们一开始做互联网的时候说互联网怎么跟医学结合,我用 O2O 去挂号,再往下走一步就是智能诊疗,它学了各种各样医生给人看病,把这些东西记录下来它就学会了,我作为一个机器你问我,我也可以继续跟你对答如流,最后我可以告诉你你得了什么病。
这是现在人工智能和医学领域结合的现状。再往下是基因测序,它越来越把人体数字化了,基因跟疾病之间有什么关系,现在我们已知的都是单基因治病,这是很简单的东西,也都是一些罕见病,未来我们可以知道那些基因的组合会得一种常见病。这些东西也都需要人工智能,需要机器学习的算法搞清楚哪些基因的组合导致什么病。
再往下走,我们目前已知的化合物,有多少是有可能变药的,过去制药工业,靠人工一个一个去试。未来也会像汽车和飞机一样有一个仿真。哪些最有可能是真正的药,然后让生物学家去试。仅仅一个行业,你可以看到从不同的层面,我们想象到是革命性的去改变这个行业。大家不管你在哪个行业,只要下点工夫琢磨,都有机会。
张鹏:这真是让人兴奋的,AI 这件事对未来有根本性的重塑。今天来的都是极客群体,做产品的,工程师等等。我们作为极客这么多年也有一个根本的变化。极客的定义可能现在又有变化吗,极客的未来也有变化了。我们以前说编程的人有能力通过程序建造一个虚拟的世界,打造新的工具,新的生产力,现在 AI 起来之后机制不太一样。包括对怎么做产品,AI 的存在,所有产品都要重新思考,大家下一步怎么做呢?就像以前我们学一个语言,AI 起来之后我们的未来会怎么办?
李彦宏:我觉得 AI 的时代是极客最好的时代,AI 处在技术井喷的阶段,在很多领域的应用我们都可以看得到,但是还没有实现。所有的极客在我们看来是在新技术领域是对技术演进最敏感的人,他们也是最愿意尝试新东西的人。
即使这个技术看上去也很烂,一般人一用觉得不好就走了。极客用着不好就把它改好了,我们看到人工智能在很多地方的应用都处在这个阶段。我们的极客如果找到自己感兴趣、擅长的领域去发掘这些机会,我觉得比移动互联网时代,PC 互联网时代的机会都要多得多。
它能看到未来它有多大的影响力。
张鹏:极客的精神在这个时代越来越起作用了,这是很重要的变化。
说到这点,我们也要谈谈人要变化有些东西要发扬,有些技能要改变。百度也是一样,我记得当年你们在北大资源楼做第一次发布会的时候我也去了,非常非常早。那个年代的环境和现在天差地别,第一数字化的程度,第二,人的连接性。现在是高度数字化,高度连接性的时代。在这个时代,整个社会会就一个新的常态,这个新常态下对每个人可能都有影响,包括百度。
我其实是很感兴趣,你怎么在这么一个新的环境下定义百度未来的价值,未来的使命?这些东西我们很感兴趣。
李彦宏:百度的使命从成立到现在我们没有变过,就是让人们最平等、便捷的获取信息,找到所求。搜索引擎本身也在进一快速的演进,早期都是关键词的匹配,到人工智能时代很多信息输入都是语音输入、图像输入,语音和图像的检索行为在百度过去一年当中占比一年×2。
这两个叫做多模的搜索,比例一年之内翻了一倍。所以,我们看到它本身在不停的变化,让我们每天都觉得很兴奋,就太多的东西可以去做。而除了搜索之外,百度今天做的很多东西也是基于过去搜索上的积累。我们做的金融方面的东西也是基于我们对用户的这些画像,我比别人更了解你的时候才知道该不该给你贷款。或者我知道你该买哪些理财的产品,我们现在做的信息流也是根据每个人看到的信息都不一样,我怎么能够猜出来你最感兴趣的是什么,这些背后全部都是人工智能的,机器学习的技术,用户画像的能力。
张鹏:在这个环境下有足够多的数据,足够多的连接之后,百度提供的服务也是有变化。是在提升的,原来就是把信息找到,连接给你。好像你们有些能力要打通到现实世界了,自动驾驶,包括未来可能去做很多制造业智能化升级,这个还是蛮让人期待的。
李彦宏:我们就是想把基础的东西做好,让每个企业,每个行业都能够从中获益。
张鹏:最近百度发布了一个新的 OS,DuerOS。我挺想了解这是什么?
李彦宏:这个 DuerOS 其实简单说就是一个仔细语言的人机界面,是做对话的。我刚才说你要想跟桌子说话,这个桌子要加载了 DuerOS,你就可以用语音跟它交互。它背后是这么一个东西,但是智能家居,工业互联网、物联网这些东西讲了很长时间,但是这里面最最本质的区别,过去人们只是说我把它连起来了,用机器的命运控制它。将来就了 DuerOS,你可以不用任何机器的语言,用仔细的语言就可以跟它聊天,任何的环境下,任何的领域都要具备这种能力,这就是 DuerOS 的定位。
张鹏:它就是非常典型的说要赋能的能力,给到更多人可以应用,更多的行业可以应用到。
李彦宏:对。
张鹏:最后一个问题,这个比较个人,你现在的时间怎么分配?我们都感兴趣,时间怎么分配?你对什么现在最感兴趣?
李彦宏:时间上,反正2/3 在北京,1/3 到处在 travel。
张鹏:是找方向、找资源?
李彦宏:找人才。大部分时间都是待在公司里面开会。
张鹏:还是花很多时间在公司内部沟通和推进?
李彦宏:对。
张鹏:还没有超脱成到处去演讲的人?
李彦宏:可能是我本人的兴趣吧,我不喜欢到处去演讲。极客可能最懂我,我就老来。
张鹏:之前我们做了一个调查,记者们说为什么老是你,我觉得确实有一群人是有类似的感觉。为什么我问这个问题,你怎么花时间,你关注的焦点是什么,这点也是会对中国的极客群体是一个引领,我们应该在关注在什么东西上,极客群体应该把自己的力量、智慧、时间放在哪些方向上。
李彦宏:广义讲是人工智能,如果收窄一点就是自然语言的人机界面,这个是未来非常非常令人兴奋的发展方向,未来会有更多的产业到这上面来。
张鹏:今天在这,在座的也欢迎加入到李彦宏的站队继续往前推进,度秘下一场战斗我们非常期待,我们非常期待结果。你赌什么呢?
李彦宏:我赌赢。
张鹏:我们用热烈的掌声感谢李彦宏第一次来到极客公园,谢谢。