从天河 2 号到神威·太湖之光,中国超级计算机(HPC)已经称霸 TOP500 榜单三年了,美国最快的超算还是多年建造的“泰坦”,当了三年多的 TOP500 老二。在下一代超算上,美国、中国以及欧洲、日本都启动了亿亿次(Exascale)超算研发,中国在E级超算上很可能继续领先,预计 2020 年前就建成,美国的E级超算要在 2022-2023 年才能研发出来,只不过说E级超算上说中国领先还早,因为美国的目标是研发出真实应用中达到 1 百亿亿次的超级计算机,计算效率以及能耗方面要比现在的超算有质的变化。
E 级超算是 Exascale,计算性能也就是 1000PFlops,百亿亿次量级的,而目前 TOP500 排名第一的是太湖之光浮点性能最高 12.5 亿亿次,因此E级超算性能性能大约是当前最强超算的 10 倍,大约是美国最强超算“泰坦”的 50 倍。
中国的超算这几年进步很快,不仅连续七次实现了 TOP500 夺冠,而且超算的核心处理器也在逐渐国产化,神威·太湖之光使用的就是中国研发的 260 核申威处理器。在E级超算上,中国也启动了至少三个项目——国防科大、中科曙光以及神威E级超算。
在下一代超算上,中国很可能在E级超算上再次领先,TOP500 榜单联合创始人、田纳西大学教授 Jack Dongarra 表示“中国将在 2020 年前得到E级超算,美国的E级超算会在 2022-2023 年实现。”,虽然从公开报道中我们知道中国所谓 2020 年实现E级计算也只是原型机而已,不过看起来在时间进度上中国领先美国两三年时间还是有可能的。
但是中国下一代超算真的能完全领先美国吗?在实现处理器国产化之后,国内E级超算肯定也会探索内存系统、网络系统、存储系统以及计算效率、能耗等方面的问题,但美国的E级超算很可能实现一次质变,EETimes 在采访美国研究人员时得知美国下一代超算不仅仅是性能提升,他们的重点是在真实环境应用中E级计算,包括 AMD、IBM、Intel、HP 在内的六家美国公司预计会在明年公布具体细节。
实际应用中达到E级性能意味着什么?要知道此前的 HP 超算虽然浮点性能惊人,但真实环境中受到各种因素制约,可用性能与理论性能相去甚远,以太湖之光为例,其理论性能为 125.4PFLOPS,Linpack 浮点性能 93PFLOPS,HPL 效率是 74.16%,但在更具实战意义的 HPCG 性能(高度共轭梯度基准测试)中,太湖之光只有 0.371PFLOPS,效率则只有 0.3%,这比天河 2 号的 1.1% 还要低。
从这一点上来看,中国在 HPC 领域进步有目共睹,但中国科研人员也应该知道美国在 HP 领域依然有绝对的实力,这几年没有追求超算第一并不是技术不行,而是需求不足,而且他们是在憋大招,在探索超算效率、能耗方面的革命性提升,中国在这方面依然是追赶者,并不能掉以轻心。