大赛 byp.com.cn

大赛
Back

AI CONTEST

ILSVRC

ILSVRC，ImageNet Large Scale Visual Recognition Challenge （官网）。从2010年开始举办，到2017年最后一届（在算法层面已经刷过拟合了，再比下去意义不是很大了）。12-15年期间在ImageNet比赛上提出了一些经典网络，比如AlexNet，ZFNet，OverFeat，VGG，Inception，ResNet。
16年之后也有一些经典网络，比如WideResNet，FractalNet，DenseNet，ResNeXt，DPN，SENet（各届冠军|ImageNet）。

ImgeNet数据集，是ILSVRC竞赛使用的数据集，由斯坦福大学李飞飞教授主导，包含了超过1500万张全尺度的有标记图片。ILSVRC比赛每年从ImageNet数据集抽出部分样本，以2012年为例，比赛的训练集包含1281167张图片，验证集包含5万张图片，测试集为10万张图片。

ILSVRC竞赛项目主要包括如下几个问题：

（1）图像分类与目标定位（CLS-LOC）：图像分类的任务是要判断图片中物体在1000个分类中所属的类别，主要采用top-5错误率的评估方式，即对于每张图给出5次猜测结果，如果5次中有一次命中真实类别就算正确分类，最后统计没有命中的错误率。

2012年之前，图像分类最好的成绩是26%的错误率，2012年AlexNet（神经网络的坚守者Geoffrey Hinton和他的学生Alex Krizhevsky所设计的基于卷积神经网络的AlexNet）的出现降低了10个百分点，错误率降到了15.3%。2016年，公安部第三研究所选派的“搜神”（Trimps-Soushen）代表队在这一项目中获得冠军，将成绩提高到仅有2.9%的错误率。

（2）目标检测（DET）;（3）视频目标检测（VID）；（4）场景分类（Scene）

（从左到右依次为Ilya Sutskever、Alex Krizhevsky和Geoffrey Hinton）

自1956年提出人工智能概念之后，2012年的ILSVRC大赛中以AlexNet为代表的深度神经网络所带来的震撼性“ImageNet时刻”，标志着AI发展彻底突飞猛进。当时，经过50年的刻苦研究，时任多伦多大学教授的Geoffrey Hinton和他的两名博士生Ilya Sutskever、Alex Krizhevsky终于发现，只要借助两样东西就能让神经网络成功识别出图片中的物体：一是数据，也就是海量的图片，因此数据集对他们的研究至关重要；二是强大的计算处理能力。2012年，他们终于集齐了这两大“利器”：斯坦福大学教授李飞飞创建的ImageNet数据集，初衷就是为了帮助人们研发出可识别图片中物体的技术，并且每一年都会举办公开比赛；另一方面，Alex发现，他写的GPU代码可以训练一个小型卷积网络，并在60秒内输出很不错的结果。
这这一年的ImageNet竞赛上，神经网络AlexNet识别物体的准确率远超其他方法，在比赛中一举夺魁，人们由此真正认识并承认神经网络的强大。除了展示神经网络的强大能量，Hinton和他的团队还积极地将其推广到工业领域。2013年初，以Google、微软、DeepMind、百度等为代表的科技公司纷纷加入了“收购”Hinton三人组公司DNN Research的竞拍战中，最终Google以4400万美元的“天价”将其收入囊中。

（从左到右依次为Yann LeCun、Geoffrey Hinton和Yoshua Bengio）

List All 大赛 | Last update: 2022-11-13|Pageview:5