第633章 ImageNet挑战赛开启,赛制堪比天梯排位
时间进入2009年12月中旬。
墙上的电子挂锺跳到上午十点整。
对于写字楼里的上班族来说,年底只意味着写不完的年终总结。
但对于京城邮电大学计算机系教研室里的人来说,今天是个大日子。
郭长征站在电脑屏幕前。
楚一航坐在椅子上,右手握着滑鼠,左手习惯性地搓着下巴上的络腮胡。
记住首发网站域名??????????.??????
旁边站着研究生锺柏丶江深和叶言。
电脑浏览器上,ImageNet视觉识别挑战赛的官方网站正式开放访问。
楚一航点击刷新按钮。
原本只有倒计时的页面瞬间变了模样,深蓝色的导航栏加载出来。
赛题和规则文档连结出现在页面正中央。
锺柏赶紧凑近屏幕,指着其中一行英文。
「上面说,开放了一百二十万张图像,作为训练集?这数据量有点离谱吧。」
楚一航摸了摸下巴。
「以前的视觉识别比赛,搞个几万张图片就算顶格配置了。」
「这次一上来就直接放出百万级别的数据集,跨度太惊人了。」
「主办方这明摆着是鼓励大家别走寻常路,逼着所有参赛队伍去点新的科技树啊。」
「而且这是明示大家,要用GPU去处理图片,传统的CPU干冒烟了,也处理不过来这么多图片。」
叶言在旁边点头赞同,补充说明。
「确实,要是继续用传统的老算法去跑这百万张图像的特徵,算到比赛结束都跑不完第一轮。」
「除了训练集,还有五万张验证集图片,这部分是带标签答案的,是让方便我们对自己的模型,先内部评估一下。」
「算是模拟试卷。」
楚一航继续往下念规则。
「十五万张测试集图片,答案不公开。」
「这就是这个比赛真正的考题了。」
「我们需要用自己的算法,预测这十五万张测试集的标签,然后上传到官网。」
郭长征看着比赛周期说明。
「比赛为期三个月,到明年3月15日截止。」
锺柏指着「Upload」按钮旁边的一行小字。
「这上面写着,比赛期间可以随时提交预测结果。」
「官网会根据提交的结果,动态更新每个团队的当前排名。」
叶言愣了一下。
「实时排名?还能这样玩?」
楚一航乐了,拍了拍大腿。
「这哪是搞学术,这纯纯是网游里的天梯排位赛啊。」
锺柏也跟着分析。
「以前的学术比赛,都是大家蒙头搞几个月。」
「最后一天统一提交,组委会再花几天时间评阅,最后放榜。」
郭长征思索着这种新赛制带来的变化。
「实时更新排名,意味着所有参赛队伍都能看到别人的进度。」
「这就倒逼着大家一刻不能停,只要被人超了,就得继续优化模型重新跑。」
叶言接着念规则。
「整个比赛期间,每个帐号最多只能上传五次预测结果。」
「最终成绩,取五次中得分最高的那一次。」
楚一航啧了一声。
「五次机会,这不就是排位赛里的保级赛机制吗?用完就只能干瞪眼看别人上分了。」
锺柏继续看排名机制的具体算法。
「榜单分为Top-1正确率和Top-5正确率两个实时排名。」
楚一航看着那两条榜单规则,直接乐了。
「这赛事主办方也太懂年轻人了,硬生生把沉闷的学术比赛做出了电子竞技的刺激感。」
叶言在一旁兴奋地搓了搓手。
「确实有意思,以前搞研究只能自己一个队伍闷头死磕代码,毫无互动可言。」
「现在搞出实时排行榜和提交次数限制,直接变成了全网极客在线大乱斗。」
锺柏的胜负欲完全被勾起来了,声音都不自觉地拔高。
「这么一来,咱们上传成绩的时间节点就非常讲究了,还得跟全世界的其他队伍玩心理战。」
郭长征看着几个干劲十足的年轻人,笑着点头。
「这种赛制把竞争完全摆在明面上,确实能最大程度逼出大家的好胜心。」
楚一航双手在键盘上快速敲击了两下,眼神里全是跃跃欲试。
「那还等什么?我已经迫不及待想下场,好好蹂躏他们了。」
……
至于为什么这次比赛的赛制,会如此有意思,还要说回两周前。
远在魔都的高档写字楼里。
英伟达中国大区总经理张建忠的桌面上,放着ImageNet赛事的最终赞助确认书。
秘书小刘站在办公桌对面,正在汇报赛事的媒体宣发情况。
「张总,ImageNet官网已经按照我们的要求,把实时排行榜功能上线了。」
张建忠翻看着文件。
「李飞飞教授那边没再提出什么异议吧?」
小刘摇头。
「没有。他们团队的资金缺口很大,亚马逊的众包标注平台收费很高。」
「我们这笔赞助解了他们的燃眉之急,对于赛制修改的要求,他们全盘接受了。」
张建忠拿笔在文件上签下名字。
实时排行榜这个点子,就是他本人向总部提议,并要求加进ImageNet比赛里的。
传统的学术比赛太过沉闷,圈外人根本不关心。
既然英伟达赞助这次比赛的核心诉求就是热度,那就需要一种能让媒体持续报导丶能让参赛者产生焦虑感和竞争欲的机制。
排行榜就是最好的焦虑制造机。
为了放大这种竞争欲,英伟达不仅赞助了赛事运营,还单独设立了三万美元的冠军奖金。
小刘提出一个疑问。
「张总,官网还开通了论文和代码同步公开的功能。」
「这也是我们提的诉求。」
「您就这么确信,排在前面的队伍,会用我们英伟达的CUDA架构吗。」
张建忠靠在椅背上。
「这不需要确信,这是概率学。」
「目前市面上能提供大规模并行计算能力,且被学术界广泛接受的,就只有我们的显卡。」
「高校那些传统的图像特徵提取算法,处理几千张图片还行。」
「面对一百二十万张的庞大数据集,传统的CPU计算模式根本跑不动。」
小刘接着问。
「万一有人用AMD的显卡呢?」
张建忠笑了笑。
「硬体只是躯壳,生态才是灵魂。」
「AMD没有CUDA这样成熟的底层调用架构。」
「研究员拿了AMD的卡,连最基础的矩阵运算库都要自己从头写。」
「三个月的比赛时间,光写底层代码都不够,还比什么赛?」
小刘翻开手里的另一份简报。
「那盛夏科技前两个月推出的那个九章计算平台呢?」
张建忠听到这个名字,手指在桌面上敲了两下。
「九章确实是个变数,它能兼容AMD的硬体。」
「但一个推出才两个月的新平台,很多高校的老师,甚至都没听过它的名字。」
「研究员们习惯了我们英伟达的工具链,谁会冒着比赛失利的风险,去踩一个新平台的坑?」
张建忠对目前的局势判断非常清晰。
英伟达通过几年的高校赞助,已经完成了用户习惯的初步绑定。
这三万美元的奖金,就是用来收割这批高校用户的成果的。
只要前几名使用了CUDA并在官网上公开技术论文或者源码,那就是对英伟达最好的免费GG。
一秒记住【笔趣阁】
biquge120.net,更新快,无弹窗!