设为首页 加为收藏

首页>要闻

中国超算——决战“速度之巅”

来源:中国纪检监察报发布时间:2018-05-21

  5月16日开幕的第二届世界智能大会上,“天河三号”超级计算机原型机首次亮相。告别前代的英特尔芯片,实现原型机及芯片的自主设计,并将于6月底部署安装。

  超级计算机是功能最强、运算速度最快、存储容量最大的一类计算机,在高科技领域和尖端技术研究中不可替代。从天气预报到洋流预测,从工业仿真到新药研制……超级计算机离我们的生活其实并不遥远。

  全球超级计算机500强榜单中,由神威、天河、曙光三大系列超算领衔的中国有202台上榜,是拥有高性能超算最多的国家。其中,从设计制造之初就立足全自主国产化的神威系列最为抢眼,每秒峰值运算速度达12.5亿亿次的“神威·太湖之光”已占据榜首近2年。

  公开资料显示,下一代神威E级原型机将于今年6月在山东济南建成并投入使用。未来E级超算研制成功后,运算能力可达每秒百亿亿次。近日,记者赶赴位于济南市齐鲁软件园的国家超级计算济南中心,探访我国超算发展的前世今生。

坚定走上自主研发之路

  成立于2011年10月的国家超级计算济南中心(以下简称“济南中心”),依托山东省科学院下属的山东省计算中心建立,是科技部批准的六家国家级超算中心之一。

  在济南中心的机房,记者看到,9组黑色机柜围成圆圈状,构成超级计算机的“大脑”。

  “圆圈状机柜里的设备相当于普通计算机的CPU(中央处理器)、内存和网络,另一侧排成一列的机柜设备相当于普通计算机的存储,再加上辅助支持设备,共同组成了整个超级计算机。”该中心工作人员李丽君介绍说。

  济南中心目前在运行的这台超级计算机叫做“神威蓝光”,由国家并行计算机工程技术研究中心研制,是我国第一台完全国产的千万亿次计算机系统。2011年10月刚投入运行时,拥有中国第二、世界第十四快的计算速度。

  “‘神威蓝光’全部采用国产CPU及配套软硬件系统构建。”山东省计算中心党委书记、副主任谭安辉说,全机共装配8704片自主研发的“申威1600”处理器,每个处理器有16个核心。“神威蓝光”的峰值性能达到1.0706千万亿次浮点运算/秒,持续性能为0.796千万亿次浮点运算/秒,组装密度和性能功耗比在当时居世界先进水平。

  现在来看,超算国产化的决定是正确的。2015年,美国对我国3家超算中心及相关单位禁运高端英特尔“至强”服务器芯片,这一被认为意在“精确狙击”中国超算发展的举动,更加坚定了国内超算团队走自主研发的道路。

  2016年10月,“神威蓝光”的继任者、至今仍是全球最快的“神威·太湖之光”在江苏无锡正式亮相。二者使用的CPU和系统架构一脉相承。可以说,正是前者的研发和应用经验,奠定了后者成功的基础。

  “神威蓝光”的另一个特点,是节能环保。它采用先进的水冷降温技术,冷却剂在冷板内部的封闭水循环带走主板热量,与传统的风扇散热相比没有噪音。一系列相关节能技术,也使济南中心去年年底成功入围第一批“国家绿色数据中心名单”。

没有最快,只有更快

  始于1993年的全球超级计算机500强榜单,由美国和德国超算专家联合编制,每半年发布一期,是给全球已安装的超级计算机排座次的知名排行榜。在2001年,榜单上连一台中国超算都没有。

  时间来到2009年,科技部批准成立国家超级计算天津中心,正式揭开了我国超算快速发展的大幕。此后,天河系列超算部署在天津、长沙和广州三个中心;神威系列超算部署在无锡和济南中心;曙光系列超算部署在深圳中心。

  2010年11月,位于天津中心的“天河一号”首次为中国拿下全球500强榜单冠军,峰值速度每秒4700万亿次。后来随着2013年6月广州中心“天河二号”和2016年6月无锡中心“神威·太湖之光”的先后登场,中国超算快速崛起并连续“霸榜”。

  在去年11月发布的最新榜单中,“神威·太湖之光”和“天河二号”依旧占据前两名。“神威·太湖之光”采用我国自主研发的“申威26010”处理器,每个处理器有260个核心;其每秒12.5亿亿次的峰值性能、每秒9.3亿亿次的持续性能和每瓦60亿次的性能功耗比均为世界第一。

  从最新的上榜总数看,中国为202台,多于美国的144台。其他国家与中美相比都有巨大差距,第三名的日本仅有35台,德国、法国和英国分别以20台、18台和15台位居第四至第六名。在累计运算性能方面,中国超算占所有超算总性能的35.3%,超过美国的29.8%,同样获得第一。

  然而,美国仍然占据优势。从前十名数量看,美国占据近半壁江山,日本、中国和欧洲分别以3台、2台和1台紧随其后。500强榜单里,有471台超算使用的是美国英特尔芯片。目前美国正在研制的Summit超级计算机,有望在今年重回榜首。

算天、算地、算海、算人

  超级计算机的价值在于应用。在济南服役近7年时间的“神威蓝光”,都算了什么?

  “我们可以从身边的天气说起。”济南中心副研究员郭猛告诉记者,山东省气象局是济南中心重要的服务对象和合作伙伴之一,两家科研单位建立的集合数值预报系统实现了全国范围5公里、济南3公里网格密度的气象计算。也就是说,在济南市,“神威蓝光”提供的天气预报可以精确到3公里范围内。

  除了气象,“神威蓝光”在海洋方面也有重要应用。郭猛介绍,通过海洋动力学计算,可以预测洋流流向、流速,在浒苔、溢油等灾害来袭时提前预测其漂流方向,做好防范。

  此外,超级计算机还可以分析人的基因测序数据,找出疾病隐患;帮助药企筛选出合适的候选药物,加快新药研发;对大到汽车、小到具体零部件进行大批量仿真模拟实验,为企业降低新产品研发的成本……

  “这是一个计算力需求越来越大的时代。超算要发展,光有硬件不行,还要有软件、有人才,做成生态。”谭安辉认为,以前人们觉得只要机器能跑起来、速度能达到预期就行,现在大家都意识到软件的重要性,“重硬轻软”的观念正在转变。

  近年来,济南中心部署了四百多个超算应用课题,支持了三百多项国家级和省级项目,资源利用率保持在70%以上,同时还成立云计算、大数据和人工智能团队,与超算团队共同推进项目研发。

  “性能有500强榜单,应用则看戈登贝尔奖。”郭猛说,设立于1987年的戈登贝尔奖,被喻为高性能计算应用领域的诺贝尔奖。

  资料显示,戈登贝尔奖评比异常严格,每年仅从三到六个入围项目中,选出一个获奖。在前29年的时间里,该奖项一直被美国和日本垄断。

  中国的突破始自2016年。这一年,中国有3项应用入围,最终基于“神威·太湖之光”的“千万核可扩展全球大气动力学全隐式模拟”项目首次获得戈登贝尔奖。2017年度评比中,中国有2项应用入围,其中又是基于“神威·太湖之光”的“非线性地震模拟”项目再次斩获该奖。戈登贝尔奖出资人、美国计算机学家戈登·贝尔认为,中国在超算应用领域的发展让人惊叹。

  郭猛表示,获得戈登贝尔奖,要拥有世界领先的领域科研团队、并行应用开发团队、软件优化团队和超级计算机,四者缺一不可。连续两年获奖,证明我国超算应用软件的研制水平和应用水平已显著提升。

  “做生态要耐得住寂寞。”谭安辉坦陈,自主研发的道路注定布满荆棘,国产并行应用软件开发周期长,需要领域专家、超级计算机系统制造方和软件人员继续努力。

向每秒百亿亿次进发

  济南中心落地近7年,如今迎来了新的机遇——根据计划,我国下一代神威E级原型机正在济南中心开建,并将于6月竣工投用。

  “E级原型机的速度可达到每秒5千万亿次,是目前‘神威蓝光’的5倍,而体积却不到它的十分之一。”郭猛介绍,当前的超级计算机都属于P级。P代表千万亿次(Petaflop),E代表百亿亿次(Exascale),1E=1000P。

  接下来,济南中心将联合申请2020年前后在青岛部署真正的E级超算,预计投资超过30亿元。将来的E级超算运算速度可达“神威·太湖之光”的8倍多——每秒运算将达到惊人的百亿亿次。

  为更好聚合济南和青岛的超算资源,两地之间将通过架设高速网络,以云计算平台实现一体化运营,形成资源的对接和互补。

  目前,济南到青岛的网速是10G/秒,今年年底将建好新的网络系统,网速将升级到100G/秒。这相当于在山东最重要的两大超算之间修通了一条信息高速公路。

  “这是超算联网的新尝试。”谭安辉表示,将来,在国产自主可控的E级超算支撑下,济南和青岛将构建全球海洋领域最强计算能力的“深蓝大脑”,为科研团队和业务部门提供大规模可扩展的并行计算服务、大数据服务和智能计算服务,加快实施透明海洋、深海极地、蓝色生命等大科学计划及国家海洋战略。(记者姜永斌 张晓明)

Copyright www.sdjj.gov.cn All Rights Reserved 山东省纪委监委版权所有网站首页网站声明 鲁公网安备 37010302000911号鲁ICP备05019079号-2技术支持:山东省互联网传媒集团