大赛
AI CONTEST
ILSVRC
ILSVRC,ImageNet Large Scale Visual Recognition Challenge (官网)。从2010年开始举办,到2017年最后一届(在算法层面已经刷过拟合了,再比下去意义不是很大了)。12-15年期间在ImageNet比赛上提出了一些经典网络,比如AlexNet,ZFNet,OverFeat,VGG,Inception,ResNet。
16年之后也有一些经典网络,比如WideResNet,FractalNet,DenseNet,ResNeXt,DPN,SENet(各届冠军|ImageNet)。
ImgeNet数据集,是ILSVRC竞赛使用的数据集,由斯坦福大学李飞飞教授主导,包含了超过1500万张全尺度的有标记图片。ILSVRC比赛每年从ImageNet数据集抽出部分样本,以2012年为例,比赛的训练集包含1281167张图片,验证集包含5万张图片,测试集为10万张图片。
ILSVRC竞赛项目主要包括如下几个问题:
(1)图像分类与目标定位(CLS-LOC):图像分类的任务是要判断图片中物体在1000个分类中所属的类别,主要采用top-5错误率的评估方式,即对于每张图给出5次猜测结果,如果5次中有一次命中真实类别就算正确分类,最后统计没有命中的错误率。
2012年之前,图像分类最好的成绩是26%的错误率,2012年AlexNet(神经网络的坚守者Geoffrey Hinton和他的学生Alex Krizhevsky所设计的基于卷积神经网络的AlexNet)的出现降低了10个百分点,错误率降到了15.3%。2016年,公安部第三研究所选派的“搜神”(Trimps-Soushen)代表队在这一项目中获得冠军,将成绩提高到仅有2.9%的错误率。
(2)目标检测(DET);(3)视频目标检测(VID);(4)场景分类(Scene)
(从左到右依次为Ilya Sutskever、Alex Krizhevsky和Geoffrey Hinton)
自1956年提出人工智能概念之后,2012年的ILSVRC大赛中以AlexNet为代表的深度神经网络所带来的震撼性“ImageNet时刻”,标志着AI发展彻底突飞猛进。当时,经过50年的刻苦研究,时任多伦多大学教授的Geoffrey Hinton和他的两名博士生Ilya Sutskever、Alex Krizhevsky终于发现,只要借助两样东西就能让神经网络成功识别出图片中的物体:一是数据,也就是海量的图片,因此数据集对他们的研究至关重要;二是强大的计算处理能力。2012年,他们终于集齐了这两大“利器”:斯坦福大学教授李飞飞创建的ImageNet数据集,初衷就是为了帮助人们研发出可识别图片中物体的技术,并且每一年都会举办公开比赛;另一方面,Alex发现,他写的GPU代码可以训练一个小型卷积网络,并在60秒内输出很不错的结果。
这这一年的ImageNet竞赛上,神经网络AlexNet识别物体的准确率远超其他方法,在比赛中一举夺魁,人们由此真正认识并承认神经网络的强大。除了展示神经网络的强大能量,Hinton和他的团队还积极地将其推广到工业领域。2013年初,以Google、微软、DeepMind、百度等为代表的科技公司纷纷加入了“收购”Hinton三人组公司DNN Research的竞拍战中,最终Google以4400万美元的“天价”将其收入囊中。
(从左到右依次为Yann LeCun、Geoffrey Hinton和Yoshua Bengio)