【编者按】本文受访嘉宾任小枫 6 月 26 日加入阿里,担任阿里人工智能核心团队 iDST 的副院长和首席科学家。基于曾经参加亚马逊无人便利店研究项目的经验,任小枫对无人便利店这一新风口的本质及未来进行了深度分析。
本文发于天下网商,作者何承轩;经亿欧编辑,供行业人士参考。
穿着白色亚麻短袖衬衫,脚蹬一双凉鞋,蓄络腮胡,用的还是已停售的 Amazon FirePhone,与其说是一个科研从业者,任小枫看起来更像是一个潜心修行的教徒。7 月 7 日,在阿里巴巴西溪园区,他接受了《天下网商》等媒体的专访。
6 月 26 日,前亚马逊资深主任科学家任小枫正式确认加入阿里巴巴,担任阿里人工智能核心团队 iDST 的副院长和首席科学家。28 日,他从西雅图飞回中国,先后在北京和杭州了解阿里多个部门的业务情况和技术需求。
在国内为期两周不到的“报到”之后,任小枫将回到西雅图,与 iDST 院长金榕以及另一位副院长华先胜一起,拟招募组建计算机视觉团队,进行技术开发,并通过阿里云向外提供服务。iDST 在杭州、北京、西雅图、硅谷等地均有团队分布,覆盖机器学习、大数据挖掘、自然语言处理、移动搜索、多媒体识别等领域。
任小枫加入阿里备受业内关注,不仅是因为“人工智能”概念的火热——他还曾领导亚马逊计算机视觉算法团队,参与创建无人便利店项目 Amazon Go。而阿里在“无人商店”这一领域也有所发力。在计算机视觉领域,任小枫对图像分类,物体识别、跟踪、检测,事件检测均有全面且深入的理解。
在这次专访中,任小枫谈到自己对于计算机视觉技术、无人商店等目前发展的认识,并表示自己接下来会更多地投入计算机视觉技术的基础性研究,比如图像、视频方面,而非针对某个具体的应用场景。
(Q=《天下网商》等媒体,A=任小枫)
谈入职阿里:研究方向很多业务都能用上
Q:是什么吸引你到阿里?对你所做的计算机视觉技术领域的研究来说,阿里会是好的环境吗?
A:我是杭州人。杭州是一个很重要的因素,因为父母、朋友。为中国公司工作也是一个非常大的吸引因素。另一个是这个公司业务布局很广,(我)有很多东西可以做。
阿里业务中,很多场景多少都能用上计算机视觉技术,比如淘宝购物的以图搜图、优酷土豆的视频云。
Q:上次回杭州是什么时候?这次回国,与阿里各部门接触,有什么感受?
A:上次回杭州是两年前。心态不一样,以前是带孩子回来玩的,这次是来工作的。说到感受,这两天我去了一下杭州钱江新城新开的 shopping mall,一进去视觉效果非常好,美国的商城就没有那么有现代感。感觉中国现在发展非常快,包括共享单车也是美国没有的。
至于阿里,有很多地方和亚马逊很像,做很多业务,注重实际。如果说到区别的话,美国人做事有很多规章制度和流程。在阿里,更加重视人之间的交流,和同事感觉更加接近。虽然以后还是在西雅图,但希望能经常过来。
Q:金榕老师是怎么找到你的?当时对 iDST 做的事有了解吗?
A:和金老师谈得比较多的,是阿里对 iDST、对视觉都非常重视,公司也希望能更国际化,在海外多招募一些人才。当时我对 iDST 有一些了解,但不是太多。主要在亚马逊时,都在埋头做研究(笑)。
Q:加入阿里之后,你的研究方向是否会和无人便利店相关?或者会有其他一些落地应用的目标吗?
A:我可能不会一下子去做(和在亚马逊时)同样的东西。在 iDST,我还是希望多推动一些比较基础的技术,包括图像、视频。公司也有很多需要,很多场景,不一定非得是无人零售的场景。但在落地应用上,很大程度上还是要我们自己去探索和寻找。
Q:西雅图团队要扩大,对于招人你有什么偏好?
A:希望他比较聪明能干,懂的东西多,能学,愿意去研究比较实际的问题。因为会有人更愿意去使用新方法,有人更愿意去解决实际问题,后者对于我们团队,对阿里来说可能更需要。
Q:在阿里,你有什么目标?
A:了解公司,适应公司,在阿里做出好东西来。希望技术上足够好,也能让大家都用上。希望西雅图做的东西和(杭州)这边不要有隔阂。
谈无人超市:不是为了减少人力成本
Q:作为 Amazon Go 的参与创建者,您觉得“无人商店”要多少年才能真正落地,突破的点会在哪?
A:还不太好说。其实技术发展得很快,无论采用什么解决方案,从技术角度而言都不会花太长时间,在商业实践上会更久一点。而且很多无人商店解决方案不一样,导致体验也都不相同。
就计算机视觉技术而言,难点很多,因为世界是三维的,从机器的相机看出去是二维的,造成很多问题,比如遮挡,光照条件、颜色的不一样。而且还有各种各样的场景、物品、人和动作。不过,随着技术在不断进步,很多情况是可以解决的。
Q:如果把 Amazon Go 的解决方案放到中国来,是不是必须要做一些调整?比如人力成本,中国比美国低,可能在这方面的需求还不是特别迫切。
A:亚马逊做无人商店的出发点并不是为了节省人力成本,主要是为了用户体验,节省排队时间,让大家更方便的购物。人力成本这个还是相对的,中国也不便宜。
我做计算机视觉技术已经很多年了,还是比较相信通过它能做很多事情,无人商店是其中一个比较好的解决方案。可能从美国到中国要做一些调整,但不会有本质区别。
Q:你对国内出现的其他无人商店解决方案有了解吗?你觉得各自的优势和劣势是什么?在公开报道里,Amazon Go 通过识别商品在货架上的移动把它加入购物车,出门的时候结算;有的解决方案是在出门的时候同时完成这两步;有的是扫描掌纹开门,自助在无人柜台结算。
A:不同的解决方案,可能都会对用户体验造成各自限制。比如在出门结算的通道,是不是要多停留一会儿,两个人一起出来行不行。是不是要在一个相对固定的地方互动。
对于机器视觉,在技术不成熟的时候,甚至会因为角度问题,看到的人脸形状变化而识别不出。当然,无人商店的解决方案也不是纯靠计算机视觉,还有其他技术在里面。
谈生活:对人工智能的未来保持乐观
Q:你觉得你的研究对人们的生活会有什么改变?
A:机器视觉里其实有非常多的信息,只是现在不能够完全把这些信息取出来。但这些相机会越变越智能,看到更多的东西。无人车就是非常大的改变,Amazon Go 也是。将来应该还会有更多例子。
Q:你自己的生活中会有用到计算机视觉技术吗?
A:我的生活比较简单……我们家没有电视,但我会用 Youtube 搜索推荐,还有 Google Photos,这些都会用到计算机视觉技术。
Q:能否谈谈工作之外的生活?会给你的研究带来灵感吗?
A:一大部分就是带小孩(笑)。有时候也会想,小孩几岁能看清楚东西,识别东西。
Q:在你小时候,有想过长大后要做个科学家吗?
A:我们那一代,好像很多小孩都会想要当科学家。我倒也有一点,但也没有想太多,不是以后非得当个科学家不可。
Q:你是在什么时候开始明确要搞科研?
A:从读研究生开始,接触前沿研究,那时候计算机视觉技术还非常不成熟,我觉得是个很有意思的问题。很难,但和生活比较接近。
Q:目前在学术界和工业界,有哪些你比较满意的成绩?把研究落地应用会是科研从业者相对比较终极的目标么?
A:我在工业界还没有做太多东西,所以前几年做的 Amazon Go 算是一个自己相对满意的成绩。学术界做的东西就比较杂,还没有自己觉得特别满意的成绩。就落地应用来说,因人而异,对我来说算一个目标。
Q:你觉得人工智能的未来会是怎样?会超越人类智慧吗?
A:我觉得有了人工智能,这个世界应该变得更好吧,人就可以去做更有意思、更难的事情,但这只是技术的一个发展方向——机器代替人去做简单的,人不愿意做的事情。还有一个是帮助人做好人的工作。最后就是马云老师说的,做人不能做的事情。这几点都挺重要的。
技术进步导致社会的改变,这是很自然的过程,中间也可能产生很多问题要解决。但总体来说,技术进步会帮助人类来进步。
至于超越人类智慧,是有可能的。但我觉得这天还早,作为一线技术人员不会考虑,起码不会考虑太多,虽然很多人在考虑。