通知公告

创新创业 当前位置:网站首页 > 通知公告 > 创新创业

【竞赛】2019中国高校计算机大赛——大数据挑战赛

作者:创新创业中心 来源:创新创业中心 阅读次数:1259日期:2019/05/08

  • QQ截图20190508172414.png

大赛官网:https://www.kesci.com/home/competition/5cb80fd312c371002b12355f

赛事背景

       中国高校计算机大赛是由教育部高等学校计算机类专业教学指导委员会、教育部高等学校软件工程专业教学指导委员会、教育部高等学校大学计算机课程教学指导委员会和全国高等学校计算机教育研究会联合主办,面向高校学生的高水平计算机类系列竞赛,其中大数据挑战赛被列入全国普通高校学科竞赛排行榜,获得社会各界的高度关注和广泛好评。

       2019大数据挑战赛(以下简称“大赛”)是在中国高校计算机大赛主办单位的指导下,由清华大学、南开大学与字节跳动公司联合主办,亚马逊AWS提供资源支持以及科赛提供竞赛平台支持,并以企业真实场景和实际数据为基础的高端算法竞赛。大赛面向全球高校在校生开放,旨在提升高校学生对数据分析与处理的算法研究与技术应用能力,探索大数据的核心科学与技术问题,尝试创新大数据技术,推动大数据的产学研用,本次大赛鼓励高校教师参与指导。

参赛对象

       大赛面向中国及境外在校学生(包括高职高专、本科、研究生),具体要求如下:

       可以单人参赛或自由组队,每个参赛队伍人数最多不超过3人,允许跨年级、跨专业、跨校组队。

      每人只能参加一支队伍(即个人参赛后不可再与他人组队参赛,或个人参加一个队伍后不可再参加另一个队伍),允许最多有一名指导老师,指导教师须为在职高校教师。

      报名时应具有在校学籍,已毕业的学生不具备参赛资格。

      参赛选手应保证报名信息准确有效,报名时应在大赛网站上提供所在学校开具的学籍证明材料。

      大赛主办和技术支持单位如有机会接触赛题和相关数据的人员不允许参赛。

赛制说明

       本次大赛分为报名&预选赛、初赛、复赛和决赛四个阶段,其中预选赛是由参赛队伍根据预选赛题在本地进行算法设计和调试并在官网提交结果进行评测;初赛和复赛均要求参赛者在科赛网的K-Lab平台上进行数据处理、算法调试和生成结果,可使用平台提供的计算资源和工具包;决赛要求参赛者进行现场演示和答辩。

1.报名&预选赛(428615日)

报名方式:登录大赛官网,完成个人信息注册并提交在校学籍证明;报名信息经审核通过后以个人形式参加预选赛,大赛不收取任何报名费用。

预选赛:报名成功之后,参赛选手从大赛官方网站下载数据,在本地进行算法调试,并在线提交结果。如果最终成绩达到规定分数线,选手将收到晋级初赛的通知邮件。预选赛的详细情况见附件“预选赛——文本情感分类模型”。

报名时间:2019年4月28日−6月15日,报名截止时间是2019年6月15日16:00。

大赛官网:www.kesci.com/landing/bdc2019

大赛官方交流QQ群:753413531

2.初赛(526630日)

       参赛队伍需要在科赛网的K-Lab平台上完成数据处理、建模、算法调试、生成结果等,所有比赛数据均不可下载,可使用平台提供的计算资源和工具包。

参赛选手通过预选赛之后,可以组队参加正式比赛。组队成功之后,选手可以从大赛网站下载比赛的sample样本数据文件,理解和分析竞赛数据模式。

5月26日12:00开始,竞赛平台提供1亿的初赛训练数据,用于参赛队伍训练模型以及制定预估策略;同时,平台提供5百万的测试数据,用于参赛队伍在比赛中的模型评估和排名。

5月26日12:00−6月30日12:00,系统每天进行2次评测和排名,评测开始时间为当天12:00和23:00。参赛队伍可以在一天内多次提交结果,以当前最后提交的结果文件进行评测。系统按照评测指标从高到低进行排序,定时更新排行榜。排行榜将选择参赛队伍在本阶段的历史最优成绩进行排名展示。

       初赛截止时间是6月30日12:00,TOP10团队将获得初赛奖励,初赛成绩排名前100名参赛队伍将进入复赛。

3.复赛(715811日)

       复赛参赛队伍需要在科赛网的K-Lab平台上完成数据处理、建模、算法调试、生成结果等,所有比赛数据不可下载,可使用平台提供的计算资源和工具包。

7月15日12:00开始,竞赛平台提供10亿的训练数据,用于参赛队伍训练模型以及制定预估策略;同时,平台提供2千万的测试数据,用于参赛队伍在比赛中的模型评估和排名。

7月15日12:00−8月10日23:00,系统每天进行2次评测和排名,评测开始时间为当天12:00和23:00。参赛队伍可以在一天内多次提交结果,以当前最后提交的结果文件进行评测。系统按照评测指标从高到低进行排序,定时更新排行榜;排行榜将选择参赛队伍在本阶段的历史最优成绩进行排名展示。

8月3日12:00开始,竞赛平台提供1亿的最终成绩测试数据,此数据集仅用于复赛队伍的最终成绩评比和排名,不参与比赛过程中每天排名。

8月11日12:00,系统根据最终测试集的评估结果,公布所有复赛队伍的最终成绩和排名。

       复赛截止时间是8月11日12:00,TOP10团队的代码需要进行审核,符合要求的排名前10名参赛队伍选手将受邀参加决赛。

4.决赛(8月中旬

       决赛将以现场答辩会的形式进行,晋级决赛团队需提前准备答辩材料,包括答辩PPT、参赛总结、算法核心代码。

       答辩现场,每支队伍面对评委有15分钟的陈述时间和10分钟的问答时间。评委将根据选手的技术思路、理论深度和现场表现进行综合评分。

       决赛分数将根据参赛队伍的算法成绩和答辩成绩加权得出,评分权重为复赛B阶段70%,决赛答辩30%。

       决赛地点和时间安排另行通知,受邀参加决赛的选手在北京决赛期间的食宿由大赛组委会安排,往返交通费及其他费用自理。

备注

1.学院联系人:庞老师;办公地点:主楼B1-415;电话:0454-15597173;邮箱:naydnhd@163.com

2.需要开具学籍证明材料的同学请联系学院联系人。

3.进入决赛的队伍,学院可支持往返交通费,具体信息请联系学院联系人。