近日,中国自主研发的超级计算机“神威·太湖之光”在2017国际高性能计算大会上再次蝉联世界超算冠军,拿下了中国国产超算系统在世界计算机冠军宝座上的首个三连冠,再加上之前天河二号六次夺冠的辉煌历史,中国超算在世界舞台十分耀眼。
但是,聚光灯下的超算虽然“跑”得快、性能好,在应用上却有短板。
“借船出海”不是常胜之策
在“神威·太湖之光”横空出世之前,中国超算天河二号曾是世界高性能计算领域的“霸主”。它六次问鼎世界TOP500,广泛应用于天气气候、生物医药、新材料等科研领域。但却也遭受“诟病”,天河系列的处理器来自美国——天河一号是英特尔的CPU加上英伟达的GPU;天河二号是英特尔的GPU加上英特尔的众核处理器。
“买来的芯片技术成熟、作用发挥快,虽不失为一种发展的策略,但是技术的自主可控无法实现。”清华大学计算机系博士后甘霖7月28日在接受科技日报记者采访时表示,2015年美国宣布对华核心处理器禁运的一系列措施也直接导致天河系里的发展受阻。
“天河二号通过‘借船出海’超越美国的泰坦等超级计算机,但是在涉及国防安全等关键领域,国家对自主可控已经提出明确的要求。”甘霖表示,关键技术受制于人,虽然可以“师夷长技”,却在应用层面大打折扣。
中国芯让超算绝地“反击”
中国超算在“神威·太湖之光”问鼎世界后为何备受振奋?背后的原因是,面对美国禁售的单方“制裁”,中国超算全面采用自主研制的中国芯——“申威26010”异构众核处理器实现绝地“反击”,公众的认识也从“单纯以速度取胜”转化为“自主可控、峰值速度、持续性能、绿色指标、应用等方面实现了全面突破”。
国家计算流体力学实验室利用基于“神威·太湖之光”开发的“航天飞行器统一算法数值模拟”软件,完成了多组天宫一号飞行器陨落飞行状态的大规模并行计算。使用16384个处理器(太湖之光整机的1/8)在20天内完成常规需要12个月的计算任务,计算结果与风洞实验结果符合较好。而且,与航天领域息息相关的材料学也需要通过模拟计算哪些元素的加入能达到最有效果。
现在,太湖之光的峰值运算性能达到每秒12.54亿亿次。这意味着,太湖之光1分钟的计算能力,相当于全球72亿人同时用计算器不间断计算32年。显然,中国超算的硬件能力并非“徒有虚名”,那么,如此超强的能力究竟有没有用武之地?
“中层断档”限制应用扩增
2016年,在太湖之光上“奔跑”着的一个应用项目获得“戈登·贝尔”奖,实现了我国在世界高性能应用领域29年来零的突破。
该项目“千万核可扩展全球大气动力学全隐式模拟”是使用了超过一千万个核来完成一次气候的数值仿真。其特殊之处在于算法——一个新的“全隐式”计算方法,这个算法的计算效率比当前国际上同类问题最高水平提升了近一个数量级。“戈登·贝尔”获奖团队负责人、中科院软件所研究员杨超曾表示,算法和性能是团队获奖的主要原因。
高性能计算实现应用的落地绝非超级计算机的一己之力就能完成。它更像是一个链条,由中间层的软件串联起上游的应用场景和下游的机器硬件。清华大学教授、国家超级计算无锡中心主任杨广文在接受科技日报记者采访时表示,从事计算机研究的人因为不熟悉应用而设计不出更好的算法及应用软件,而做软件应用的人因为欠缺计算机能力而造不出高质量的软件……即便技术成熟、需求旺盛,只要软件缺乏,超算的能力就无法施展。
而且,中国面临更大的问题在于,不只是软件落后,软件生态与国外也有一定的差距。甘霖举例说:太湖之光的众核处理器相当于1000万只蚂蚁在协调一致、同时拉动重物,如果一只蚂蚁“牺牲”了,这只蚂蚁的任务量就需要软件分配给其他仍在工作的蚂蚁,以保证计算合理进行。这个看似简单的步骤需要通用软件来控制,形成容错和纠错的机制。虽然中国也有,但不及国外成熟的软件。在太湖之光上运行的大部分程序,先前都需要针对太湖之光的硬件特点进行代码修改以实现优化,这种调优的过程要依靠软件工具。
“虽手握‘戈登·贝尔’奖,但要全面提升我国超算应用水平仍任重道远。”杨广文讲得很直接。这类似于刚刚脱离实验室,功效可以预见,实施仍待检验。杨广文认为,要做好超算的应用,需要科研人员有“工匠精神”。
从硬件到软件,中国奋起直追,不断发力,从跟跑追到并跑。在国家层面,国家重大科技专项中多个项目都在资助超算支持下的领域应用,投入持续加大。杨广文表示,系统的政策、项目与人才支持会促使超算的研发反哺产业发展,促进国家产业转型与升级。
量子计算与超算不存在竞争关系
在“2017年国际大数据与E级计算研讨会”上,杨广文曾透露,“神威·太湖之光”新一代百亿亿次超算的研制已经列入国家“十三五”规划,目前高性能计算重点专项支持了“神威”“天河”“曙光”三台原型机的研制,有望在2020年左右推出首台国产百亿亿级次超级计算机。
从十亿亿级提高到百亿亿级面临着巨大挑战。杨广文向科技日报记者表示,计算能力的提升导致功耗越来越大,采用低功耗芯片设计、高效的制冷技术、对整个系统管理的优化管理是目前正在着手攻克的难题。
与新兴的量子计算机相比,甘霖认为,下一代超级计算机与其在几十年内不存在竞争关系。相较于传统计算机1比特只能由0或1的两种表示,量子计算机依靠量子的不确定性,实现量子表示的多态表达,比如量子比特可能有多种状态的表达,有可能使量子计算机在同一规模下比传统计算机的能力要强很多,但成型时间的不确定性就给这种可能性增加了更多未知数。
“量子计算机要想成熟起来,肯定要有一个成熟的算法,而且这个算法得能够模拟应用,与量子不确定性匹配起来,才能产生期望的效果。”甘霖表示,这也导致只有特定的应用领域是量子计算机适合的。
“在下一代超算的发展与竞争中,中国不仅要赢得速度之战,更重要的是赢得应用之战!”杨广文说,国产应用软件的滞后和人才的缺乏,严重制约了超算的发展。以“致用”为终极目标,“神威·太湖之光”团队将进一步组织国内外优势力量,共同打造国产芯片生态环境,加强应用软件开发,特别要在气象气候服务、先进制造、生命健康、大数据分析等重点应用领域做足功课,突破应用瓶颈,补齐中国超算应用短板。
新闻链接
“神威·太湖之光”创造出最大的虚拟宇宙
据香港《南华早报》网站7月27日报道,中国科学家打破纪录,用世界运算速度最快的“神威·太湖之光”计算机创造出最大的虚拟宇宙。
专家们说,中国正在学习如何充分利用这台计算机的纯运算能力,再现宇宙的形成过程只是第一步。就纯运算能力而言,中国近年来已经超过其他国家。研究人员希望中国在3年内能够成为研究宇宙形成问题的领军者。
报道称,下一代高性能计算机的研制将让科研人员得以结合其他先进科技设备破解宇宙的秘密,比如世界上口径最大的射电望远镜。科研人员在“神威·太湖之光”计算机——或者今后出现的更加先进的机型上——能够模拟宇宙的形成过程,就可以定位太空中遥远的地方,让射电望远镜进行观测。
中国科学院国家天文台数值宇宙学团组首席科学家高亮说,他们用了10万亿个数字粒子来模拟宇宙的形成和早期扩张。他还说,这个项目的规模是之前世界纪录的五倍,世界纪录是瑞士苏黎世大学的天文物理学家上个月才创造的。这个项目是两个月前在江苏无锡的国家超级计算中心开展的。
另一名参与该项目的科学家王乔7月26日在本报撰文,第一次向公众披露了这次宇宙模拟的情况。
据《南华早报》报道,“神威·太湖之光”凭借前所未有的性能让竞争对手望尘莫及。同时,中国已经开始建造下一代高性能计算机,其运算速度至少是“神威·太湖之光”的10倍。高亮说预计在2019年建成,届时中国的天文学家在破解宇宙奥秘时,将拥有比多数国家同行更强大的运算资源。高亮说,2020年后,宇宙新发现也许会向中国转移。