骑猪兜风

Prisma爆红这么久 现在才有中国追随者

骑猪兜风 2016-08-09 07:47:19    200795 次浏览

  赵陈婷

  [对于大多数Prisma用户而言,最大的不满依然来自于图片处理的时间太长,一般都需要等待几十秒才能看到预览效果。]

  “朝生暮死”的APP行业无异于一个造星工厂,几乎每隔一段时间就能捧红一款明星产品。而图片处理软件堪称爆款APP中最为常见的分类。

  有这样一个评论描述如今的Prisma有多火,“世界一半人在用《PokemonGO》抓精灵,另一半人在用Prisma软件修图。”

  Prisma成功刷屏朋友圈之后,有国内图片处理软件公司产品负责人明确向《第一财经日报》记者表示,Prisma的爆红提醒了我们用户对艺术类风格特效存在巨大需求,公司会考虑开发类似Prisma的产品。

  但与AR手游《PokemonGo》刚上线就遭遇国内《城市精灵GO》山寨不同的是,6月上线之后就迅速地从俄罗斯风靡至全球的Prisma在模仿、借鉴已经足够普及的中国市场一直等到最近才找到“追随者”。8月4日,图片处理应用相机360在更新后的版本中添加了一个类似Prisma功能的超强马赛克,称可以让照片一秒钟变油画。

 为什么要等这么久?

  需要耐心的AI修图

  技术达人出来发话了,虽然都是在修图,Prisma和美图、PicsArt等软件在技术上走的是两条路。能将一张普通照片变成野兽派劳尔杜飞的静物画风格,也能演绎现代派大师毕加索的立体主义的Prisma背后是人工智能(ArtificialIntelligence,简称AI),Prisma以艺术的名义用流行的方式把深度学习的能力展现给了大众。

  那么,能让连俄罗斯总理梅德韦杰夫都“翻了它的牌子”,在Instagram上放了一张使用Prisma过滤的莫斯科风景图,这个由莫斯科年仅25岁的AlexeyMoiseenkov和几个人的团队开发的修图应用到底在技术上牛在哪里?

  图普科技研发工程师Darwin告诉《第一财经日报》记者,在处理技术方面,美图、PicsArt等图像编辑软件提供的主要功能基本上是基于底层的数字图像处理技术,如滤波、去噪,或一些稍高级的功能分割、人脸检测等;而Prisma所做的风格转换使用的是完完全全的机器视觉技术,实现纹理转换(texturetransfer)。“绘画、吟诗、作曲是人的高级智能的表现,Prisma的风格转换让大众有了机器可以作画的错觉,在效果上更高级、更智能。”

  Prisma的产品由来是因为创始人AlexeyMoiseenkov最初发现了一种开源的人工智能算法,能将照片变为经典艺术作品的风格,然而这一处理过程需要几小时时间。因此,他的团队开发了自主版本,能在较短时间内返回结果,适合在移动设备上使用。

  但目前对于大多数Prisma用户而言,最大的不满依然来自于图片处理的时间太长,一般都需要等待几十秒才能看到预览效果。

  而这背后,Prisma的产品特性要求用户在使用时一定要在有网络状态较好、网速较快的状态下,因为需要在线加载绘画风格图像以及用户提供的内容图片需要发送到远程的服务器上进行人工智能计算后再传回来;此外,因为所有的图片处理都是在云端完成,所以会有少部分用户遇到使用人数过多,服务器过载的情况。

  但在人工智能技术专家们看来,即使Prisma的处理速度的确超出了平常大众一般可以忍受的App处理时间的上限,但Prisma能达到这样的速度其实已实属不易,里面涉及到大量的算法改进和性能优化。

  在Prisma出现之前,也有过一款基于深度学习技术的修图应用deepart.io。deepart.io却无法取得像Prisma一样的成功的主要原因是一方面在于其处理一张图片需要消耗大量的GPU时间,导致了很多服务器资源开销,如果用户愿意承担这部分费用,处理时间在半小时左右,如果不付费的话,需要6个小时左右;而另一方面,deepart主要是由大学的研究员做的技术性实验,并不会投入过多的精力,在风格图像类型、品牌推广和商业化应用上考虑较少。

  在图普科技研发工程师Darwin看来,使用深度学习的方式进行风格转换在技术层面上看属于从0到1的创举,将这种无与伦比风格转换效果工程化、落地化最终展现给大众从产品层面上看也是从0到1的进步,之后越来越好的效果,越来越快的速度只是不断地在1后面添0,在如今极速发展的AI技术面前,相信速度的问题会很快就得以解决。

 爆红过后的困境

  即使有AI技术做背书,业界对于Prisma的未来依然存在担忧。Prisma如此惊人的风格转换的效果暂时掩盖了其产品单薄的缺陷,但当热度退去,Prisma是否会像之前众多爆款的App一样稍纵即逝,取决于Prisma之后采取的商业策略。

  在中国市场上,从魔漫相机、脸萌、足记到现在的Prisma,似乎每过一段时间就会出现一个爆款图片应用产品。然而,这些满足一部分需求的图片工具类产品在爆红之后往往并不能走得特别长远。

  一位不愿意透露姓名的图片处理工程师坦言,因为Prisma是强风格的滤镜,用户容易产生厌倦心理,未来要考虑的优化方向是开发更多新奇效果,或者做产品定位的转型上。爆发力超强的产品,都会存在持久力不足的特点。新鲜劲儿过去以后,如何把用户留住,是重要的课题。

  如果没有考虑清楚这一步,迅速地变现也是个好方法。AlexeyMoiseenkov7月份来到总部参加了一次FacebookLive的直播的消息也被业界解读为Facebook可能有意收购Prisma。

  而这背后,被大平台收购是创意工具类应用普遍的发展思路。在此之前,Snapchat先后以1.5亿美元和1亿美元收购了可动自拍应用Looksery和自定义头像制作应用Bitmoji,而Facebook此前也收购了提供类似于Looksery的脸部识别自拍应用MSQRD。

  此外,AI技术背后是Prisma使用的是昂贵的云端服务器去处理请求,这一方面体现出了其使用的深度学习计算的复杂度,另一方面更是暴露了其巨大的成本消耗,使用GPU等计算设备去处理一张图片的成本并不低。

  值得一提的是,此前有消息称Facebook可能会将Prisma整合到FacebookLive,以此鼓励更多用户尝试直播。此举将有助于消除用户面对镜头时的紧张感,因为Prisma的滤镜可以掩盖用户皮肤和环境灯光的问题。

  尽管Prisma团队此前表示正在开发视频滤镜功能,但在AI技术工程师们看来,图像是一个二维的信号,而视频多了一个时间的维度,对时间提供的信息的利用决定了视频的处理在面临更大计算量的同时也拥有更多的可用的信息量。

  “Prisma的‘视频滤镜’一方面要处理计算量的问题,保证‘快’,另一方面也要考虑如何利用好时间的信息,进一步提升‘质’。用图片的方式对视频每一帧进行处理是可行的,但由于如今的风格转换算法还不是特别的稳定,所以用这种处理方式生成的视频会闪烁和出现假的不连续性(falsediscontinuities)。”在Darwin看来,从图像的处理到视频的处理,其中牵涉到大量算法,并不是一件看起来很容易的事,而他的判断是最终这项视频功能可能还是以用云端离线的方式处理短视频呈现给大众。

  另外的担忧是,类似Prisma的视频滤镜会增加直播的趣味性。但从产生影响的角度,可能不像对图片的影响这么大。“直播的重点是内容和互动,对于大多数用户而言,美颜、滤镜只是辅助性的手段。”上述图片处理工程师解释道。

  而这背后,除了Prisma和未来的视频滤镜,AI技术尤其是深度学习仅仅在机器视觉领域,已经在人脸识别、OCR(光学字符识别)、车辆检测、图像检索等领域得到一定的成功的应用。

  《第一财经日报》记者了解到,在图像内容审核上,如今可以使用深度学习技术成功地将图像智能鉴黄交给了AI机器,使得大量不良内容被阻挡免于流向大众,从而解放了更多的人力去做更有意义的事。此外,也能在人脸识别应用上,完成包括人脸搜索、定位、识别、智能美化等功能。

内容加载中