全球最具挑战性的超算竞赛 ASC:由我国倡议成立,为中华培育人才

时间:2021-05-22 13:02      

1929 年,超级计算(Supercomputing)首次出现在《纽约世界报》的报道中。由成百上千甚至更多处理器组成的超级计算机,是解决重大科学问题的重要工具,如今正在发挥越来越重要的作用。

2010 年 11 月,中国首台千万亿次超级计算机系统“天河一号”在 TOP500 组织发布的全球超算排行榜中位列第一。此后,“天河二号”也在 2013 年 6 月 - 2016 年 6 月间获得了 6 连冠(TOP500 榜单每年 6 月和 11 月更新)。

2016 年超越“天河二号”的最强超级计算机同样来自中国,名为神威?太湖之光。

“2010 年之后,我国超级计算机建设和部署取得了较大成果,进入超算 TOP500 榜单的计算机数量也大幅增长。”ASC 世界大学生超级计算机竞赛组委会委员刘军说,“虽然我们在硬件方面投入了很多,但在这些超级计算机上运行的应用和软件,尤其是超算结合产业和科研创新的能力相对而言还很弱,其根本的原因是人才储备远远不足。”

于是,ASC 世界大学生超级计算机竞赛(ASC Student Supercomputer Challenge)于 2012 年发轫,由中国倡议成立,与日本、俄罗斯、韩国、新加坡、泰国、中国台湾、中国香港等国家和地区的超算专家和机构共同发起并组织,得到美国、欧洲等国家地区超算学者和组织的积极响应支持。

历经 9 年,ASC 从中国到亚洲再到世界的规模升级,影响力不断攀升,如今 ASC 与 SC、ISC 并称全球三大大学生超算竞赛,吸引了全球近万名大学精英人才参与。

受疫情影响,ASC 20-21 竞赛创新性的采用了线下、线上同步举行的方式,分为报名、初赛和决赛三个阶段,由亚洲超算协会、南方科技大学、浪潮集团共同主办。5 月 8 日至 12 日,从 300 多支参赛队伍脱颖而出,进入线下总决赛的 21 支队伍在南方科技大学激烈角逐,最终 ASC20-21 总决赛冠军由黑马暨南大学拿下,清华大学获得亚军,e Prize 计算挑战奖和最高计算性能奖分别由清华大学和中山大学获得。

暨南大学代表队

线上竞赛的 7 支队伍中,中国台湾新竹清华大学获得冠军。

ASC 的目标是培养中国超算人才,促进全球顶超算人才的交流与合作,在这个过程中,ASC 如何培养中国的超算人才?

全球最具挑战的超算竞赛

ASC 与美国 SC、德国 ISC 并称为全球三大超算竞赛。每年,ASC 最先举办,一般在四五月份,接下来是 ISC,大概在六七月举行,SC 则会在年底举行。打头阵的 ASC 也是三大超算竞赛中最具挑战性的赛事。

全球超级计算机排行榜 TOP500 发起人,美国工程院院士,橡树岭国家实验室及田纳西大学教授杰克?唐加拉(Jack Dongarra)说:“我参与过全球主要的大学生超算竞赛,和国际同类竞赛相比,ASC 是最激烈的,也是最具挑战性的超算竞赛。参赛队员要在短短五天内完成系统的组装,调试以及比赛。”

ASC20-21 南方科技大学决赛现场

这意味着,ASC 的参赛队员比拼的不仅是脑力,还有动手能力和体力。作为在同类比赛中第一个引入世界顶级超算系统作为竞赛平台的赛事,ASC 在 2014 年引入了当时全球最快的超级计算机作为竞赛平台,2017 年将超级计算机神威?太湖之光作为竞赛平台。

同时,ASC 致力于通过竞赛实现与国际大科学问题的结合,为参赛队员创造更多与国际大科学工程亲密接触的机会。ASC15 竞赛与世界最大射电天文望远镜项目 SKA 合作,将其应用 Gridding 作为赛题,ASC17 竞赛采用戈登?贝尔奖入围应用高分辨率海浪数值模拟 MASNUM 及无人驾驶领域 AI 应用作为竞赛赛题。

不仅如此,ASC 竞赛还与领先的科技企业合作开展人工智能方面的赛题创新。比如 ASC17 人工智能赛题为 Baidu 提供的交通预测应用,ASC18 人工智能赛题为微软提供的自然语言阅读理解中的搜索提问回答预测。

延续 ASC 一贯的推动青年人才培养,引导大学生们运用超算挑战前沿科学问题的目标。ASC20-21 总决赛的赛题包括基于 FAST(中国天眼)真实观测数据搜索脉冲星、训练人工智能模型参加英语考试、用经典计算机模拟量子计算、跨队伍合作的超级团队赛、跨尺度天气预报模式 MPAS-A、超算基准测试 HPL 和 HPCG 等。

这些赛题不仅让参赛队员们绞尽脑汁、学习了新知识,也激发了他们的创造力。获得 e Prize 计算挑战奖的清华大学参赛队员告诉我们:“我们是计算机系的学生,对脉冲星以及天文领域并不了解,所以我们首先需要学习一些背景知识,然后对代码进行深入分析。”

“我负责的是 AI 赛题,初赛的题目是训练 AI 模型完成完形填空,决赛的题目是阅读理解,两个赛题有比较大的差别,需要从零开始重新思考。”暨南大学参赛队员为赛题绞尽脑汁的同时也会灵光乍现,“为了缩短训练时间,我们需要用分布式计算的方法,我们学校的设备不太适合分布式计算,所以是到了现场直接调试,在很急切的情况下调试成功,这算临场发挥,也有灵光乍现。”

中山大学的参赛队员形容决赛的过程就像坐过山车,“我以前的想法是高性能计算不需要控制功耗,结果决赛要求参赛队伍要在 3000W 功耗约束下设计搭建超算系统。要用我们以前没有见过的最新 CPU 搭建系统,特别是发现它功率很大,我们冒险改了机器内部的走线,充分发挥了机器的算力,在 3000W 功耗约束下运行 HPL 国际基准测试,实现 79.04 万亿次 / 秒的持续浮点运算性能,创造新的世界纪录并获得最高计算性能奖。”

挖掘与培养中国超算人才

与脑力挑战并存的,是动手能力与体力的挑战。“比赛完最大的感受就是累。ISC 因为疫情采用的是线上比赛,比赛时间为 72 小时,我们有很多时间去调整策略,也可以利用跑应用的时间休息一下。ASC 两个正式比赛日每天 10 小时的时间,要完成 3-4 个赛题,意味着我们能够做的策略调整会少一些。”清华大学参赛队员同时表示。

“线下比赛让我能够认识很多新朋友,在交流中得到一些新的灵感。并且,通过调试搭建系统,我对整个计算机体系结构组成的原理有更深的理解,这是非常大的收获。”

暨南大学参赛队员也提到,“学校的服务器和比赛的服务器差别比较大,有一些硬件和软件版本的问题,我们花了比较长时间在集群方面。但一些在学校没有调好的东西在比赛现场都调试出来了,这是一个比较独特的经历。”

作为全球首个重启线下比赛的超算大赛,ASC20-21 线上、线下同步举行的赛制具有创新性,当然也具有挑战性。刘军说:“线下和线上队伍跨地区、跨时区、跨语言协作对整个比赛而言非常有意义。为了将这两种方式结合,我们进行了大量的尝试。”

这就有了超级团队赛,也就是参加总决赛的队伍通过抽签的方式随机组成 7 个超级团队,每个超级团队需包含一支线上参赛队伍,以跨团队合作的形式共同完成决赛的“超级”赛题。

ASC20-21 的超级团队赛题围绕新冠病毒展开,参赛队员使用 VENAS,尽可能用最短的时间来完成万数量级病毒基因组的变异演化网络计算。最终,由西北工业大学、华中科技大学、清华大学、俄罗斯乌拉尔联邦大学组成的联队通过对 VENAS 的高效优化,性能提升超过 10 倍,成功赢得超级团队奖。

ASC 让参赛队员能够接触,使用最新、最强的超算系统,还能贴近创新前沿,帮助解决前沿科学问题。但 ASC 的影响力不止于参赛的 10000 多名大学生。

暨南大学指导老师杨光华说:“我们从 2018 年第一次参加 ASC 时对大赛的一无所知,到如今获得冠军,在这个过程中是不断的老人带新人的滚动培养,对于促进我们的教学科研起到非常大的作用。”

南方科技大学科学与工程计算中心主任工程师范靖也说:“我们从 2016 年开始参加 ASC,在比赛的过程中学生们自发组织了南科大学生超算俱乐部,他们有自己的架构组织,也有定期的培训交流。”

在 ASC 的带动下,也有非计算机和 AI 相关专业的学生加入超算团队。中山大学参赛队员告诉我们,“我们超算三队今年会有两个航空航天学院的同学,因为他们经常需要用超算模拟很多东西,同时他们对超算也非常感兴趣,因此我们超算队也欢迎他们的加入。”

不仅如此,ASC 还在努力吸引更多人才参与其中。“国内参赛队伍特别多,水平也特别高,但总体而言还是存在不均衡的问题,西部高校参赛的频次以及进入总决赛的队伍相对东部,尤其是领先 985 高校有比较大的差距。”刘军进一步表示。

“我们希望让更多中国大学生有机会参与到 ASC。之前,我们在太原理工大学办过一次总决赛,对于西部高校来说可能比较少有这样的机会。今年我们看到,太原理工大学和山西大学的参赛队都进入了总决赛并且取得了不错的成绩。接下来,我们会做更多工作,增强 ASC 的影响力和吸引力。”

ASC 开花结果

已经走过九年的 ASC,为超算行业培养了不少人才。刘军介绍,许多 ASC 的参赛队员都工作出色,在戈登贝尔奖和很多重大科研创新里都出现了他们的身影。还有,今年支持线上比赛的 AWS 团队成员之一,就是 2016 年华中科技大学 ASC 决赛的参赛队员。

ASC 的赛题有的也在继续研究中探索产业化应用。暨南大学杨光华介绍,ASC19 有一道超分辨率赛题,就是利用 AI 将低分辨率图像转换为高分辨率图像。在大赛之后,他们将赛题中涉及到的一些 AI 模型算法应用到了无线通信领域,希望能够通过超分辨率的想法或算法,尽量降低整个系统的负载,提升系统的效率和吞吐量,目前正在继续科研和产业化。

还有一个例子,2020 年 ASC 的 NLP 赛题,涉及到自然语言理解,通过不断研究 NLP 领域的相关算法,他们也在把 NLP 算法应用到智慧医疗领域,建立医疗诊断模型,希望可以实现对病情的诊断,甚至应用到临床。

ASC20-21 的超级团队赛题,也可以帮助新冠病毒的溯源与传播研究,助力疫情防控。

正如 ASC 竞赛发起人、中国工程院院士、浪潮集团首席科学家王恩东所说:“新冠疫情让我们更加深刻意识到,只有更广泛的跨国跨地区协作与创新,才能更好地应对人类共同面临的重大挑战。超级计算机作为解决重大科学问题的重要工具,将会发挥出越来越大的作用。ASC 竞赛希望通过比赛的形式,让学生们不断扩大技术视野、丰富知识结构、珍视团队精神、强化合作意识,让他们成长为下一代计算科学家。”

杏彩网页版