游客

谷歌开源移动端计算机视觉模型:MobileNets

游客 2017-06-16 14:40:01    201166 次浏览

近年来,在深度学习的支持下,计算机视觉识别技术取得了极大的进展。现在,移动应用中大多数的机器学习都是通过将数据传输到云服务进行处理,然后再将返回的结果提供给用户。这就意味着在数据中心需要使用非常强大的计算机,还要减轻智能手机处理信息的负担。另外,这种方法延迟高,而且对隐私的保障性不好。

因此谷歌为帮助智能手机更好的识别图像,而不需要大量的消耗,向开发者推出了 MobileNets,谷歌称通过处理用户智能手机上的数据,可以快速返回结果。

MobileNets 是一系列用于 TensorFlow 中的高效、小尺寸的移动端优先计算机视觉模型,它们的设计目标是在手持或嵌入式设备有限的资源下高效地运行,并提供尽可能高的准确率。MobileNet 是小型、低延迟、低功耗的参数化模型,它为多种不同使用场景下的有限资源做了针对性的参数优化。它们可以像其他流行的大规模模型(如 Inception)一样用于分类、识别、嵌入和分割任务等。

谷歌开源移动端计算机视觉模型:MobileNets

基于 MobileNets 在移动设备上进行目标检测、细粒度分类、人脸属性和地标识别

这个 MobileNets 版本可在 TensorFlow 中使用 TF-Slim 对 MobileNet 模型进行定义,还包含 16 个训练好的 ImageNet 分类器(checkpoints),它们适用于所有不同大小的移动项目。这些模型配合 TensorFlow Mobile 的使用可在移动设备上高效地运行。

谷歌开源移动端计算机视觉模型:MobileNets

如上图所示,需要根据自己的延迟和项目大小需求选取合适的模型。网络模型在内存和磁盘中所占的空间大小和网络中参数的数量成正比。用 MACs 值(Multiply-Accumulates,累积乘法量,用来衡量乘法、加法融合计算的数量)可以估计网络的延迟和能源消耗。Top-1 和 Top-5 准确率是通过 ILSVRC 数据库测试得出的。

开发者现可使用 TensorFlow Mobile 部署模型,TensorFlow Mobile 旨在帮助您将模型部署到 Android,iOS 和 Raspberry Pi 上。

有关 MobileNets 的更多信息请点此参阅

更详细的内容请参阅谷歌的论文

此前,谷歌在 I/O 大会上公布了专门针对移动设备而优化的 Tensorflow 新版本 —— Tensorflow Lite,再到现在的 MobileNets,可以看到谷歌在移动优先的战略上又迈了一大步。

内容加载中