帐号: 密码: 站内搜索: 订阅资讯
设为首页 加入收藏
精品导读>>2009年要目|定边采风|2010年要目|2011年1月号|2011年2月号|2011年3月号|2011年4月号|2011年5月号|2011年7月号|2011年8月号|2011年9月号|2011年10月号|2011年11月号|2011年12月号|2012年1月号|2012年2月号|2012年3月号|2012年4月号|2012年5月号|2012年6月号|2012年7月号|2012年8月号|2012年9月号|2012年10月号|2012年11月号|2012年12月号|2013年1月号|2013年2月号|2013年3月号|2013年4月号|2013年5月号|2013年6月号|2013年7月号|2013年8月号|2013年9月号|2013年10月号|2013年11月号|2013年12月号|2014年1月号|2014年2月号|2014年3月号|2014年4月号|2014年5月号|2014年6月号|2014年7月号|2014年8月号|2014年10月号|2014年11月号|2014年12月号|2014年9月号|2015年1月号|2015年2月号|2015年3月号|2015年4月号|2015年5月号|2015年6月号|2015年7月号|2015年8月号|2015年9月号|2015年10月号|2015年11月号|2015年12月号|2016年1月号|2016年2月号|2016年4月号|2016年3月号|2016年4月号|2016年5月号|2016年6月号|2016年7月号|2016年8月号|2016年9月号|2016年10月号|2016年11月号|2016年12月号|2017年1月号|2017年2月号|2017年3月号|2017年4月号|2017年5月号|2017年6月号|2017年7月号|2017年8月号|2017年9月号|2017年10月号|2017年11月号|2018年1月号|2018年2月号|2018年3月号|2018年4月号|2018年5月号|2018年6月号|2018年7月号|2018年8月号|2018年9月号|2018年10月号|2018年11月号|2018年12月号
您当前位置:网站首页 >> 精品导读 >> 2016年6月号 >> 阅读文章

“国之重器”诞生记

2016-08-22 11:18:22 来源:《时代报告.中国报告文学》杂志社 浏览:887

十五的月亮,

照在家乡,照在边关。

宁静的夜晚,

你也思念,我也思念。

……

军功章里,

有你的一半,也有我的一半。

……

徐炜遐长期奋战在巨型计算机科研第一线,在高性能计算机体系结构方面学术造诣高、技术精湛,有特别丰富的大型科研工程组织管理和工程实践经验。他先后参加了银河多种型号巨型机攻关,从副主任设计师、主任设计师,一步步成长为副总设计师,突破了一系列核心关键技术,先后获得国家科技进步一等奖2项、部委级科技进步一等奖4项、军队科技进步一等奖1项。

这一项项成果、一个个奖项,都是他顽强拼搏拼出来的,长期的脑力体力透支,使他患上了糖尿病。

“天河一号”工程启动后,计算机学院计算机研究所肩负着主攻重任。徐炜遐作为一所之长,全所型号任务、科研项目、研究生培养都需要他谋划,工作可谓千头万绪。面对繁忙的工作,他常和大家开玩笑说:“要是天能变得不黑,我不睡觉照样做事,那就好了。”

2010“天河一号”二期系统升级优化工程启动后,作为“前线总指挥”,连续半年多没离开中心机房一步。每天天不亮就起床、午夜睡觉,每天只能休息四五个小时,更不用说双休日、节假日了。无常的饮食起居,过度的身体透支,使他的病情不断加重,脸色越发憔悴,身体急剧消瘦。

战友们说:“徐总,你抽点时间去医院看看吧。”

他笑笑说:“现在是关键时刻,过了这阵再说。”

他依然带病率领大家顽强奋战。待到系统初装完成,攻关告一段落时,他开始出现头晕目眩症状。大家强行把他送到医院检查,发现血糖指数已经严重超标:28!正常指标的4倍!

医生严令他住院治疗。他不得不服从“命令”,住进了病房。但躺在病床上的他依然继续工作,不是查资料,就是打电话、接电话。同志们去看望时,他嘱咐大家千万不要忘了带上各种审批单、报告单、工作计划表,及时与大家讨论研究,及时决策,把病房当成了办公室。

医生见此情景,和他开玩笑说:“徐总啊,你这住院的病人,比我们这些医生护士都忙呀。”

徐炜遐说:“这些年来,我们团队的同志,哪个不是一个当作两个用、一天当成两天干?”

战友们听了,笑道:“你一个所长、副总师都这么玩命,我们这些兵还敢不玩命?”

卢宇彤,被大家誉为“天河巾帼英雄”。这一称号,她当之无愧。

身材高挑、白白净净、端庄秀丽的她,在事业上干出了一番让很多男人羡慕不已的成就——

参加过“银河”巨型机研制,在“天河一号”超级计算机工程中,负责操作系统、资源管理系统、并行文件系统、高速通信系统和并行程序环境研制工作……这些工作,能做好一项就很不容易,她一个人却承担了这么一大串。

博士研究员、博士生导师、“天河一号”主任设计师,先后获得国家科技进步一等奖1项、军队科技进步一等奖3项,荣立个人二等功,获国家教育部“新世纪优秀人才支持计划”支持,被评为“全军巾帼建功先进个人”……这一顶顶光环,谁能戴上一个就很不简单,她一个就获得了这么多。

而这一切,都源于她在工作中的那份大家望尘莫及的气魄与拼劲。

为了赋予“天河一号”优越的通信性能,她和同事们展开了艰苦的攻关。在查阅国际相关领域大量资料,吸收国际先进技术的基础上,凭着自己扎实的理论功底和丰富的工程经验,卢宇彤提出了大胆的创新方案。经过反复实验和比较分析,终于攻克了异构混合体系结构的资源管理和作业调度难关,解决了通信软件和并行软件的大规模可扩展性、全局共享并行文件系统可靠性等难题,让“天河一号”通讯系统性能得到充分发挥,使软件通信速度比国际水平高出210%,为“天河一号”冲击世界之巅立下汗马功劳。

“天河一号”在国家超算天津中心安装运行后,很多用户提出了应用需求。为发挥“天河一号”运算潜力,助推经济发展、科技进步,卢宇彤又在最短时间内,解决了大规模系统软件配置问题,并针对用户程序应用需求特点,对系统软件的资源管理、文件系统、通信系统等性能和可靠性进行了全面优化。

为让用户用好“天河一号”,她主动与每个用户沟通,帮助用户快速理解应用模式,建立用户所需的应用运行环境,对大规模并行应用程序进行配置与调优。

那些日子里,卢宇彤白天在机房里算题,积累结果。晚上研究用户应用问题环境与特点,每天只睡两个小时。

这样的工作状态,对于一个女性、一个孩子他妈,身心的压力有多大,不言而喻。

让她最放心不下的是正处于中考前夕的小孩。她和丈夫都忙,常常两个人同时出差,孩子长期当“留守儿童”。班主任已多次给她打电话,让她多关心关心孩子。孩子是她身上掉下的肉,她和其他母亲一样爱自己的孩子,希望孩子将来有出息,可她就是忙得抽不出时间辅导孩子。

为表彰卢宇彤为“天河一号”二期工程作出的贡献,组织上给她记功一次。

那天,她把那枚闪耀着金光的军功章拿给孩子看:“你看,妈妈立功了。”

孩子亲了亲军功章,然后亲了她一下:“妈妈是好样的。”然后从自己的书包里掏出中考成绩单,“这是我的考试成绩,请妈妈过目。”

卢宇彤接过一看,全优!

她高兴得一把搂过孩子,使劲亲了一下那张小脸蛋:“以后一定要考个好大学。”

孩子附在她耳畔,轻声说:“以后我要像妈妈一样搞计算机。”

杨灿群带领计算效能提升团队在国家超算天津中心天河机房摆开了战场。他们的第一个任务,就是确保系统所有部件连续稳定运行4小时以上。哪知一开机,系统又出问题了。

他们到天津前,就在长沙做了四个机柜的验证系统,进行了稳定性调试,没有发现任何问题。天津系统所使用的部件与长沙系统完全一样,为什么就出问题了呢?

杨灿群抬头望一眼天河机房,有种一眼望不到头的感觉。并排矗立的140组机柜,其中包含了数以万计的部件,只要其中一个部件、一个系统出问题,都会影响系统的稳定性。这个问题部件、系统在哪呢?杨灿群和大伙仿佛一脚踏进一个深坑,眼前一片漆黑。

在黑暗中探索好几天,他们才发现问题竟然出在水冷系统上:由于水量不足,散热功能下降,造成超级计算机系统温度过高。

随着系统调试全面展开,他们又发现GPU也存在抽风似的波动现象。大伙通过对GPU稳定性相关因素,如GPU自身、GPU的供电模块、GPU与主机的通信接口卡、GPU散热等,一一进行大量采样分析,没有发现任何蛛丝马迹。他们又对GPU工作状态温度进行监控,通过大量数据采样分析后,发现同一个刀片上的两颗GPU的工作温度有明显差异。通过发明风量“挖补”技术,终于彻底解决了散热不均匀问题,实现了GPU稳定工作。

“天河一号”二期系统采用自主研制的互联网络系统,是个全局性的设备,也是影响系统稳定运行的关键因素。加之规模巨大,结构复杂,不仅测试难度大,而且一旦出现问题,查因、维修困难。他们通过与互联网络系统科研人员密切配合,依据网络特点研究测试方法,编写了分组、并发等多种测试代码,高效实现了网络接口、网络路径全覆盖测试,实现了故障快速定位和排除。

又一个国庆佳节来临之际,“天河一号”二期系统终于达到稳定工作目标。

已连续奋战两个月的杨灿群和战友们顾不上坐下来喝杯茶、歇歇气,立刻对系统计算效能进行最后优化。他们逐个测试系统各个计算结点,排除了内存故障、GPU故障影响计算效能问题,使计算效能提升到每秒1890万亿次。

初战告捷,他们趁势扩大战果,又对应用软件进行优化,使系统性能达到每秒2339万亿次。

这已经是个奇迹了。当时世界排名第一的美国“美洲虎”超级计算机,其计算效能也只有每秒1767万亿次。如果按照国际TOP500组织以计算效能排名,“天河一号”二期系统已将它远远甩在后边。

但杨灿群和同事们还不满足。他们认为“天河一号”还有潜力可挖。把“美洲虎”甩得越远,“天河一号”对世界第一的冲击力就越大。

他们继续把自己关在机房,发起最后冲刺。

1019日下午,杨灿群到北京办事。汽车在京津高速公路上奔驰,在通过一个立交桥时,他看着来自四面八方的车辆汇集在桥上,然后又有序地驶上四面八方,脑袋里突然灵感闪现:如果把超级计算机网络喻为城市交通枢纽,网络路径就是一条条城市街道,这些街道的交会点,往往成为交通堵塞区,车辆只有合理放行,才能保证交通畅通。

杨灿群马上给同事打电话,让他们关注网络路径,修改参数,对超级计算机计算效能再次优化。

当天晚上,“天河一号”计算效能再次冲高——每秒2490万亿次。

次日,奇迹再现——每秒2507万亿次!

1030日,“天河一号”二期系统就要向国际TOP500组织递交测试结果的前夕,他们仍在继续优化,并再下一城,将系统计算效能提高到每秒2566亿次,计算效率达到54.6%,属于世界最高水平。

曾几何时,很多外国专家在表达对中国计算机技术的鄙视时,总是这样发问:“你们中国的超级计算机有‘中国芯’吗?”

现在,还是让国外专家自己来回答吧。

全球超级计算机500强排行榜主要编撰人之一、美国田纳西大学计算机学教授唐加纳,考察了“天河一号”二期系统后,发表评论说:“虽然‘天河一号’二期系统的处理器仍主要采用美国产品,但其互联芯片完全是中国自主制造的,并且中国已经有自己的CPU了。互联芯片主要涉及处理器之间的信息流动,对于超级计算机的整体性能起到关键作用。中国制造这些互联芯片,具有世界最先进的水平。

唐加拉教授是国际高性能计算机领域的知名专家,他的评价是比较客观的。国防科技大学自主研制的高阶路由芯片和高速网络芯片,其性能是国际商用芯片的两倍。“银河飞腾1000”在“天河一号”二期系统成功使用,标志着中国信息产业“空心”历史开始走向终结。

“天河一号”二期系统较一期系统,性能再次大幅跃升:峰值速度每秒4700万亿次和持续速度每秒2566万亿次,分别提高了2.89倍和3.55倍;计算效率再次提高近10%

国防科技大学计算机学院打响的这场“上甘岭战役”,也在超级计算机领域为中华民族打出了一席之地。

201011月,在世界超级计算大会上,“天河一号”二期系统以计算峰值高出第二名——“美洲虎”两倍多的绝对优势,勇夺国际TOP500排名第一。

“天河一号”二期系统夺冠及中国系统全球占有率迅速攀高,打破了美国在超级计算机领域长期一家独大的局面,标志着我国自主研制的超级计算机综合技术水平跨入世界领先行列,更显示出中国信息领域科技创新能力和综合国力快速提升。

国防科技大学教授、国家超算天津中心主任刘光明,代表“天河一号”研制团队登上领奖台,接过刻有“中国制造”的金光灿灿的奖牌。他是自鸦片战争以来登上世界科技竞赛最高领奖台的第一个中国人!

走下领奖台,面对新华社记者的采访,刘光明按捺不住激动的心情说:“这一刻,我们几代银河人孜孜以求、苦苦等待了30多年啊。对于高性能计算机,欧美国家长期对我们中国禁运,还设立了专门从事禁运工作的巴统组织。20世纪80年代,我们气象部门想从美国克雷公司进口一台计算机,美国人就是死活不肯卖。后来我们自己搞出了这个等级的计算机,他们才很不情愿地卖给我们,还给了一台质量很差的,要经常维修,真是气人哪。现在我们‘天河一号’峰值性能、实用性能、可靠性、实用性,都进入国际领先行列。我们受气的年代,终于过去了!”

总设计师杨学军,得知“天河一号”二期系勇夺国际TOP500排名第一的消息,轻轻吁了一口气说:“我们做了一件让自己满意的事,做了一件让中国人扬眉吐气的事。”一向工作严谨、生活低调的他,竟突发诗兴,即兴赋诗一首:

梦幻天河弹指间,

电闪巡地十亿年。

滨海坐拥飞流急,

倚天妙算出奇篇。

在记者招待会上,一名新华社记者说:“听老一辈国防科大人说,20世纪80年代,国外卖给中国的机器,要封在玻璃房里,由他们自己人使用监控,不许中国科技人员进去。

杨学军沉重地嘘了口气:“心痛啊……这段真实的历史,是中国科研工作者心中永远的痛。在中国土地上,被外国人拒于‘技术大门’之外,就像农民自家没粮,母亲自己没奶喂孩子。一个科学家没有尽到责任啊。”

杨学军沉吟半晌,然后脸上浮出开心的笑容:“现在好了,别人看中国有自己的东西,愿意和我们‘对等’交流了。我们非常欢迎全世界从事超算研究、使用超算的朋友来参观天河,提意见,帮助我们天河进步。”

这就是中国底气、中国胸怀!

争霸拉锯战

20101031日,联合国秘书长潘基文造访南京大学。在向师生发表演讲时说:“每次到中国来,都惊叹于中国所展现出来的活力与日新月异的变化。今天我坐在从上海到南京的高铁上,就深深地感受到了这一点,300千米的行程只需要一个多小时,而且这速度还没有上周开通的沪杭高铁快。同时,我从新闻里了解到,中国最近研制出的‘天河一号’,也成为世界超级计算机研制领域的领跑者。速度最快的高铁,速度最快的超级计算机,形象地证明了中国的确是不断前进的国家。”

国际上正直友好、胸怀坦荡的科学家,都为“天河一号”的成功而高兴。正如路易安那大学计算机科学教授托马斯·斯特林所说:“毫无疑问,今天整个世界都在注目中国及其技术发展,而这一切都源于‘天河一号’的问世。由此可以预示,超级计算机领域将成为以后中国飞速发展的领域,我们期待着更多的激动人心的成果出现。”

“天河一号”异军突起,也让一些人心里很是不爽。正如美国弗吉尼亚理工学院一个资深计算机专家听到“天河一号”夺冠消息后,对记者所说的那样:“中国‘天河一号’二期系统的出现,在人意料之外,让人猝不及防,美国还没有做好心理准备。”香港一家媒体通过分析比较后认为:“近百年来,很少有过哪个国家的哪项技术发明,像‘天河一号’这样让美国上下如此震惊。”

美国人为什么会这样?原因就是奥巴马自己所说的——“这个领域第一通常是我们”,现在中国拿了这个第一,说明中国正在把基础设施当作投资,并期望从这些投资中获得长远回报——若按美国逻辑继续推理下去,其结果就是“对美国未来形成挑战和威胁”。

这一逻辑虽有“主观主义”色彩、“蓄意蛊惑”之嫌,但也不是没有一点道理。

新一轮超级计算机巅峰“拉锯战”拉开序幕。结果仅仅半年后,即20116月国际TOP500发布新榜单时,日本公司研制并安装于本国理化研究所的超级计算机“京”,扶摇直上,取代“天河一号”占据了榜首位置。20126月、11月,美国的超级计算机“红彬”“泰坦”,又先后登上国际TOP500排名之巅。“天河一号”排名跌到世界第8

对于日、美的反超,天河人早有预料。这是人家的优势领域、战略领地,是别人耀武扬威、傲视世界的地方,岂能容一匹“黑马”撒蹄狂奔?再说,超越与被超越的角色轮回,仰视与俯视的状态更替,既是科技发展的常态,亦是科技进步的动力,用不着耿耿于怀,更犯不上惊慌失措。

中国科学院院士、“天河一号”总设计师杨学军说:“从‘天河一号’问世那天起,‘天河二号’的攻关就开始了。在对国际高性能计算发展趋势进行分析后,我们瞄准了每秒亿亿级机器的研制,决心在引领世界超算发展中作出新的贡献。”

他们刚刚占领巅峰,又从巅峰悄悄出发,向着新的巅峰进击。

20111月,国防科技大学召开“天河工程领导小组会议”,启动“天河二号”每秒亿亿次超级计算机认证与预研工作;计算机学院院长、“天河一号”研制总指挥、副总设计师廖湘科,担任“天河二号”研制总指挥、总设计师。

沉寂两年半后,“天河”超级计算机雄姿再现,王者归来。于20136月在国际TOP500排名中,重新占领世界超算之巅!

“天河二号”峰值速度达到每秒54.9千万亿次,持续计算速度达到每秒33.86千万亿次,综合技术处于国际领先水平。

它比此前排名世界第一的美国“泰坦”超级计算机,计算速度快2倍,计算密度高2.5倍。

它与“天河一号”相比,计算性能、计算密度均提升10倍以上,能效比提升2倍,耗电量却只有“天河一号”的三分之一。

“天河二号”的计算能力,名富其实的“超级”“神算”!

中国科学院软件研究所研究员张云泉自豪地说:“体系结构之路上,中国人在拉着世界走!”

在超级计算机前沿阵地上,国防科技大学创新团队以得天独厚的“硬实力”“软实力”,一路冲刺、冲刺、再冲刺,不断谱写新的世界纪录:

201311月至201511月,“天河二号”连续6次蝉联世界排名第一,成为世界计算机史上连续夺冠最多的机器!

头顶着成功光环天河人,清醒地意识到,虽然异构融合体系结构作为主流技术,在超级计算机研制领域风头正劲,但它同样改变不了科学发展“后浪推前浪”的铁律。异构融合时代与计算机技术所经历的电子管时代、晶体管时代、集成电路时代、并行计算时代一样,终将进入“冰封”时期,而且这种迹象已逐渐显露出来。正如中国科学院院士、国防科技大学校长、CPU+GPU异构融合技术创始人杨学军在学术报告《并行计算六十年》中所言:“生物分子模拟、航空宇宙计算、飓风预测等超算高端应用的不断增长,不断推动高性能计算继续向前发展。现在,超级计算正处于从P级向E级过渡时期,而面向E级的超算正面临着巨大的挑战。科学界把这些挑战比作‘墙’,比如‘存储访问墙’‘通信墙’‘可靠性墙’‘能量墙’等等,现在这些‘墙’正随着超级计算机系统运算性能的不断抬升而越筑越高。”

而与此同时,超级计算机的国际政治地位和国家战略地位却在不断飙升,大国在超级计算机领域的竞争也在不断加剧。

2015年,美国能源局宣布:美国将投资3.25亿美元建造两套超级计算机系统,其计算速度将超出连续数次夺得国际TOP500排名第一的“天河二号”3-4倍,重新夺回世界冠军。此后,美国总统奥巴马又以行政命令授权建立“国家战略计算规划”,旨在维持并提升本国在高性能计算研究、开发和部署领域的领导地位,研制世界上第一台每秒百亿亿次计算系统。

此举,被媒体解读为“向中国下战书”!

面对挑战,天河人依然淡定地说:“大国在超级计算机领域相互超越已成常态的情况下,我们的选择只有一个,那就是超越、超越、再超越!”

高科技竞争,是一场没有终点的长征。

征战者永远在路上!

上一篇:没有了

相关文章

2016-08-22 11:18:22
2016-08-22 11:17:26
2016-08-22 11:16:28
2016-08-22 11:15:46
2016-08-22 11:14:37
2016-08-22 11:12:51
2016-08-22 11:12:05
2016-08-22 11:10:57

文章评论

现在有0人对本文发表评论 查看所有评论


关于我们 | 服务条款 | 联系我们 | 发行方式 | 京ICP备10003538号-1
地  址:北京市朝阳区东土城路13号金孔雀大厦A座516室
联系邮箱:zgbgwx2009@126.com   邮编:100013  
电话:
010-51319114  传真:010-51319113
Copyright 2019, 版权所有 www.zgbgwxzzs.com.