@cnbeining 2017-08-02T03:19:11.000000Z 字数 813 阅读 1317

Google使用3亿张图片大幅度改进图像识别算法

AI

note：原文已按文中提及论文的官方中文通稿进行校对：http://developers.googleblog.cn/2017/07/blog-post.html

摘要： Google和CMU的研究员使用高达3亿张图片，在图像识别算法上取得了长足改进。

正文：

Google和CMU的研究员使用3亿张图片，在图像识别算法的几个指标上取得了长足改进，而往常的训练一般只使用一百万张图片。

很多开发者在训练物体检测算法时会使用包含一百万张图片的ImageNet数据集。这个数据集从2011年起就没有新图片加入了。然而，在该数据集上训练的神经网络中的参数数量与日俱增，训练模型的GPU算力也在增加。卡内基梅隆大学（CMU）中Google的研究人员和科学家提出：如果增加训练数据量会如何？

原图1

于是，Google建立了一个内部数据集，含有3亿张图片，标记为18291个类别。图片标注的来源包括原始网络信号，网页之间的联系，以及用户的反馈。因为不是由人标注的，所以含有20%的噪音。

结论是：增大数据量果然有益。虽然图片标记含有噪音，算法的准确率还是提高了3个百分点。很明显，数据量的增加克服了标记的噪音。研究人员发现算法的表现和数据量呈对数关系上升，如图所示。论文作者认为，现有的模型是基于一百万张图片建立的：如果对模型进行调整，准确率还有上升空间。

原图2

研究人员在微软的COCO 对象检测基准测试上进行了测试，结果喜人：平均正确率(AP)从34.3上升到37.4。Google和CMU在ICCV会议上发布了算法和评测，并发布了论文《重新审视深度学习时代数据的非理性效果》，可在arxiv自由获取。