2009年,一条惊人的消息被披露:“天河一号”将于2009年年底至2010年在天津滨海新区安装部署,成为国家超级计算天津中心的业务主机。天津中心将以千万亿次计算能力跻身世界少数几个这样级别的超算中心行列。
超级计算机是世界公认的高新技术制高点和21世纪最重要的科学领域之一。计算能力是当今世界最重要的生产力,是衡量国家科技发展水平和国家综合国力的重要标志。国防科技大学是“天河一号”的研制者。1983年面世的中国第一台亿次计算机“银河—I”,就诞生在这所大学。
中国传统文化里,“天河”是银河的别称,“天”,又是天津的简称。这台计算机的名字是一个隐喻。标志着天津与银河计算机研发团队的合作,开启了一个辉煌的时代。
11年后的今天,天津超算中心正在研制新一代百亿亿次(E级)超级计算机。据了解,其计算能力不仅将是目前“天河一号”的百倍,还将采用自主的处理器、天河高速互连通信和麒麟操作系统,实现整个体系全自主可控。
2月初,天津中医药大学校长张伯礼请战到武汉筹建中医药综合治疗方舱医院,最终实现轻症病人零转重、痊愈病人零复阳、医护人员零感染“三个零”的亮眼成绩。中西医结合,成为新冠肺炎治疗“中国方案”的亮点,而这个亮眼的战绩中,超算占有重要的一席。
张伯礼说,天津超算中心和天津两所大学的团队火速研发了TCM-COVID症候调查手机软件,在全国率先完成了新冠肺炎大样本中医症候学调查研究,用了三天就确定了新冠肺炎的症候特征——湿毒疫,从而进一步确定了理法方药,为抗击新冠肺炎疫情贡献重要科技力量。
这一切,并非从天而降。中国超算的前世今生到底怎样?在中华民族伟大复兴、世界百年未遇“两个大局”背景下,天津又站在了怎样的历史风口?天津海河传媒中心用两年时间拍摄的纪录片《逐梦天河》,掀开了这个答案的一角。
邓小平:“中国要搞四个现代化,没有巨型机不行!”
这句话是中国改革开放的总设计师邓小平1978年说的。巨型机就是高性能计算机,又称超级计算机,是目前地球上计算能力最强的电脑。
2010年,“天河一号”以持续速度每秒2570万亿次浮点运算、峰值速度每秒4700万亿次雄冠全球。
这个速度有多强呢?可以这么想象一下:它运行1小时,相当于13亿人同时计算340年。
计算,改变了人类发展进程。两千多年前,中国人发明了算盘,总结出珠算口诀,结束了人类用手指、绳结计算数字的时代,堪称人类计算史的里程碑。随着社会不断进步,人类对于计算能力的需求水涨船高……
时间进入近代。
中国,却因为种种原因没有跟上计算的发展步伐。
1946年2月,美国“计算机之父”冯·诺依曼成功研制世界第一台电子数字计算机——ENIAC。一条炮弹飞行的轨迹, 20秒钟就能被算完,人类社会由此迈入了计算机时代的门槛。
新中国成立之后,国家百废待兴 ,我国的科研先驱在艰苦的科研实践中充分地认识到科学计算在新中国国防、科技事业中的地位和作用,也开启了计算机事业的追求与探索。
1958年,因为要研制鱼雷快艇指挥仪,哈军工海军工程系任副主任、雷达教研室主任慈云桂带领9名学员迈出了中国自主设计研制电子计算机的第一步。
1964年11月,代表我国第一代电子管技术的通用数字计算机441B,在慈云桂他们的手中宣告诞生,中国整整落后了美国12年,而在第二代晶体管计算机441-B问世后,这一技术的差距被缩短到了6年。
此后10年,随着集成电路技术的应用,世界算力再次迎来了新的突破。几乎就在中国百万次计算机诞生的同时,美国科学家运用向量技术,实现了数据批量化处理,算力直指亿次大关,这也标志着计算机前沿领域跨入高速度、大容量的巨型机时代。
面对国家经济建设的迫切需求,面对西方国家的技术封锁和卡要,中国高层领导决策者和科学家们又一次体现了远见卓识和战略定力。
1978年,对于中国算力来说,是一个载入史册的节点。那年,改革开放总设计师邓小平指出:“中国要搞四个现代化,没有巨型机不行!”阳春三月,中央召集巨型机研制部署会,研制任务,又一次落在了慈云桂的肩上。此时,这支历经哈军工分建南迁,辗转湖南长沙的科研团队,研制出的最快计算机151也只有每秒100万次,与世界亿次计算机相差甚远。
这一年,慈云桂虽已年逾花甲,却热血难耐,当即就立下了军令状,“每秒一亿次,一次不少!六年研制时间,一天不拖!预算经费,一分不超!”。
六年,是时间的长度,更是财力的厚度。西蒙·克雷之所以能研制出世界第一台每秒亿次机克雷-1,除了他的智慧,还有美国拥有世界最深厚的技术积累,最雄厚的经济支撑,最完备的工业基础…...
那时,中国工业基础薄弱,电子元器件性能和工艺水平落后,慈云桂的研究所人手不够一百, 连间像样的实验室都没有,设备严重老化,加之国外对技术的封锁,这个时候,启动每秒亿次巨型机工程,困难重重。
事实上,当慈云桂怀揣任务,回到学校时, 困难确实远比想象得多,搭团队,建厂房,攒设备,一次碰头会上,慈云桂边讨论边扳着手指头数,每根手指弯了4遍,整整40个问题,如同40座山。
建工厂需要集结大批队伍。但此时,巨型机研发团队刚刚南迁长沙,基本生活条件都难以保障,而最难过的一座大山还是巨型机的核心技术。
慈云桂团队成员、中国计算机事业先驱胡守仁说: “‘克雷1’,主频是80兆赫兹,我们只能20兆赫兹,那速度比它低。怎么能够设计出一亿次机来?向量部件是一个运算的部件,‘克雷1’只有一个,我把它搞两个,两个同时算,那不是速度提高一倍了?”
这一精妙构思,在利用落后元器件,保证巨型机算力的同时,也使设计变得更加复杂。为了配套向量部件,主存材料和存储方案必须创新;为了避开液冷技术的短板,不得不沿用风冷技术,改良通风管路。设计师前后绘制了5000多张密如蛛网的逻辑图,然而实现这一切的前提,国产元器件的质量必须过硬,哪怕有一环出现闪失,整个技术路线都要推倒重来。
这是一次以勤补拙的艰难探索,5年时间,慈云桂和全体研发人员、放弃了节假日,吃在工厂、睡在机房。当时加班费一晚上两毛钱,却没有一人来领。大家心有灵犀,为的就是省下每一分钱,用在零件、设备的生产上,尽快造出中国的巨型机。
一批科研人员,用身体做燃料,完成了对巨型机各环节的攻关,最终,全机4万多条绕接线,12万个绕接点,全机861块插件板,两百多万个手工焊点,无一错绕、无一虚焊。
1983年12月22日,新华社、人民日报等近二十家中央媒体同时向世界宣布:中国第一台每秒运算一亿次以上的“银河”巨型机研制成功。它填补了我国巨型计算机的空白,标志着中国跻身世界少数几个能研制巨型机的国家行列。
1984年,改革开放后的第一次阅兵式上,天安门广场彩旗飘扬,“银河”巨型计算机模型受阅通过天安门广场,闪耀神州。这无疑给正处于改革开放之初,充满希望的中国注入了一支强心剂。
银河巨型机一经问世,石油勘探、火箭发射模拟、空气动力学设计等各领域需求纷至沓来,大大缩小了与国外的科技差距。
因为西方设限,超级计算追赶世界的脚步不得不快
时代在飞速变化。
20世纪80年代初,中国气象局为实现中长期预报应对台风等气象灾害,希望从美国进口一台每秒10亿次巨型机,但对方提出了比出口欧洲高出近10倍的价格,并且设置了诸多技术保密的环节。进口巨型机谈判旷日持久,多年未果。
李泽椿院士说:“那时候美国、欧洲发达国家,包括日本在内,有一个巴黎统筹委员会,他们专门限制高新技术输送给(前)苏联、中国等国家,所以你必须通过他批准,你才能进口到大的计算机,否则不卖给你。非常严格。”
实践告诉中国科学家:关键核心技术是要不来、买不来、讨不来的。
作为慈云桂的接班人,银河—Ⅱ总设计师周兴铭回忆:“1986年,银河-1出来已经三年了,但从国际上来看,其实是十年以前的技术了。你不进则退呀,再不发展就落后了,所以我们心里有点着急。当时我们三个教授,陈福接、我,还有陈立杰,我们三个人就给中央写了一封信:我们已经有能力研制10亿次的机器了。我印象里很快就批复下来。”
1986年,为了满足中国气象局中长期天气预报需求,银河—Ⅱ巨型机研制项目正式上马,运算速度每秒10亿次,算力将比银河-1巨型机提高10倍,大家满怀信心、全力以赴投入研发。
可就在银河—Ⅱ横空出世的前一年,1990年7月21日11时05分,慈云桂那颗顽强不息的心脏永远停止了跳动。即便是在生命的最后时刻,他依然为“银河—Ⅱ”的研发以及学生的培养殚精竭虑。他生前说:“假如人生能实现一个梦,我的这个梦,就是让中国在世界高性能计算领域拥有一席之地。”
薪火相传,从未停止。就在慈云桂去世后的第二年,每秒10亿次并行计算机银河—Ⅱ横空出世,“胸怀祖国、团结协作、志在高峰、奋勇拼搏”的银河人完成了“银河—Ⅱ”巨型机从向量计算到并行计算的飞跃。这项技术路线的突破,不仅让银河人用四年时间走完了别人十年的路,也使得中国气象预报的预测实践和精度跨入了世界水平。
逐梦天河:“天河一号”国际T0P500排名第一
超算时代,是速度竞争的时代。
从1993年起,美国工程院院士杰克唐加拉和德国专家汉斯·沃纳梅尔联合编制了一个“TOP500(全球超级计算机500强)”榜单,从系统性能、技术方向等多个方面反映了全球超级计算机的最新发展状况,早已成为世界最权威的超级计算机“座次表”。
2010年,路易斯安娜州新奥尔良市举办的世界超级计算大会上, “天河一号”二期系统,以峰值计算速度每秒4700万亿次,高出第二名美国克雷“美洲虎”1倍多的绝对优势,勇夺国际T0P500排名第一。
“异构融合”——依靠这一体系结构的伟大创新,中国超算实现了弯道超车,成为了继美国之后世界上第二个能够研制每秒千万亿次超级计算机的国家。
“天河一号”工程启动后,时任天河一号总设计师的杨学军决定带领带科研团队在没有先例可循的路上艰难探索,走别人没有走过的路,在世界上率先采用CPU+GPU异构融合体系结构,利用GPU加速科学与工程计算应用程序。
但如何发挥GPU计算性能,是举世公认的科学难题。“天河一号”总师组将破解这个难题的艰巨任务交给了杨灿群带领的课题组。他们搭建CPU+GPU异构系统后,测算发现有强大图形处理能力的GPU针对科学与工程计算问题的计算效率只有20%左右,远远达不到“天河一号”所需的计算效率。
为了提高GPU的性能,杨灿群毅然带领课题组远离市区进行封闭式攻关,开展GPU计算效能优化研究。他们不会客、不外出,每天只做一件事:一步步优化应用程序,一遍遍测试性能优化效果,常常紧紧盯着电脑显示屏,从那些不停滚动的数据中,寻找一个个稍纵即逝的灵感,捕捉一次次优化GPU计算效率的机遇。
有一次,杨灿群从早上7点一直工作到午夜,因长时间观察电脑屏幕上的测试数据,躺到床上闭上双眼,屏幕上的数据隐约还在眼前滚动,他突然觉察到其中的几行数据可能低于期望值。他一骨碌从床上爬起来,打开与服务器相联的笔记本电脑,进入试验数据库,果然发现GPU一部分计算资源没有用起来。兴奋难抑的杨灿群,立刻着手改进程序,使GPU的计算性能又一次得到提升。类似这样的优化改进,他们在两个月里进行了一万多次,终于把GPU的计算效率提升到接近60%,充分展示了“天河一号”CPU+GPU技术的光明前景。
杨灿群带领团队连续奋战四个月,先后改进优化8万余次,创造了一个科学奇迹:GPU计算效率跃升至70%以上,为“天河一号”横空出世并冲刺世界领先水平扫清了障碍。
从中专生到博士,从助教到研究员、“天河”超级计算机副总设计师……在追逐梦想的征途中,杨灿群一次次华丽转身:先后主持国家863计划、国家自然科学基金等课题10多项,获得国家科技进步特等奖1项、一等奖1项,部委级科技进步一等奖5项。
国家超算天津中心主任杨灿群
现任国家超算天津中心主任杨灿群告诉记者,“天河”横空出世,成为我国首台世界排名第一的的超级计算机,让超级算力服务于滨海新区、京津冀,乃至全国,不断带动国家科技创新和产业发展,其示范引领效应使我国的超算系统研制和应用得到了飞速发展。
从“玻璃房子”到“超算强国梦”
去年,是孟祥飞加入国家超算天津中心的第十年。他从一个刚毕业的博士生作为技术骨干加入超算中心,到成为应用研发部部长,多年来长期负责我国重大自主创新成果“天河”系列超级计算机的应用技术研发与开拓。
孟祥飞出生在改革开放之初的1979年。当时,百业待兴,中国还没有成熟技术造自己的超级计算机。花高价买来的国外超级计算机要放在独立的机房里,只准国外的工程师用,而中国工程师只能在“玻璃房子”外面看看。这是一段令中国科技界蒙羞的过往。
回顾他的职业生涯孟祥飞感慨良多。
应用研发部部长孟祥飞(右二)
“我是研究理论物理的,研究宇宙的起源需要超级计算机去算,当时国内民用领域的超级计算机很少,没有办法,2007年,我申请公派到美国去学习,实际上就是蹭人家的超级计算平台。当时在美国,一个普通大学里面就有超级计算机,更不要说人家在国家实验室那些大研究机构,正是这些超级计算能力和现代化的研究平台,支撑了美国的先进科技创新能力,当时我就想我们国内都没有,到人家这里一个普通大学就有,什么时候能赶上人家,当时心里冲击是特别大的。”
巨大的冲击也让孟祥飞心里憋着一股劲儿,2009年学成回国后,他放弃了已经拿到手的工作邀约,加入了正在筹建当中的国家超算天津中心。
2010年,当在电话里听到“天河一号”取得了世界第一时,孟祥飞热泪盈眶:“我记得特别清楚,当时因为有时差,是在深夜里,我激动得围着机房跑了两圈。”
可在科技创新的道路上,总会面临各种非议。一些国外专家质疑,中国就是造了一台大型游戏机,中看不中用!那时候,中国超级计算机的应用领域还有很多空白。孟祥飞说:“干不好‘天河’的应用,我卷铺盖走人。”他的“狠话”并没有落空,天河超算应用团队依托技术牵引,“天河一号”的运行效率很快达到世界一流超级计算机水平,不仅推动了国家重大科技创新领域发展,还为产业领域累计增效近百亿元。
目前,“天河”系列超级计算机已经实现了在航空航天、气候气象等十多个领域的广泛应用。我们日常大众的吃穿住用行到娱乐,实际上都有超算发挥作用的影子,哪种农产品改造后更好吃,哪种材料的衣服穿起来最舒服,电影特效渲染,甚至汽车、飞机的设计等都离不开超算。
孟祥飞介绍,超级计算机可以为飞机建造一个虚拟空间的数值风洞,了解和研究飞机的稳定性、油耗等数值,像波音787这种大型飞行器,用实物的实验风洞完不成的试飞测试,都可以用超算完成虚拟试飞。高通量虚拟筛选还可以加速新药的研发,使一种新药的研发周期缩短两年,节约上亿美元的成本。
天河超算应用团队完成了一次又一次创新突破,开发出了国际首款大规模异构并行模拟软件,使“天河”成为可控核聚变研究的领先平台;参与我国雾霾预警预报与评估系统研发,构建起我国第一个高分辨率雾霾预报准业务化平台。
据了解,天津工业大数据研发中心初期计划用三年时间,搭建面向京津冀的工业大数据和工业互联网联合融合平台,借助新一代天河巨型机的计算能力,建设工业大数据创新中心,最终形成“产学研用资”全链条的工业生态,服务制造业转型升级。目前,天津超算中心正忙着在现有滨海工业云平台基础上,依托工业大数据,构建国家级工业大数据创新中心。
如今,在杰克唐加拉教授整理的TOP500名单里,中国超级计算机已经占据了228台,部署量位居世界第一。
数据即未来 信创推进产业边际不断拓宽
2019年,信创产业开始进入了大家的视野。所谓信创产业,即信息技术应用创新产业,是一个万亿级市场,它涉及到一条庞大的产业链,IT基础设置、基础软件、应用软件和信息安全等。
超级计算是信息技术创新的核心驱动,推动整个信创产业基础产品的创新。杨灿群说,过去中国 IT 底层标准、架构、产品、生态大多数都由美国 IT 巨头来制定,由此存在诸多的安全风险,也可能会被“卡脖子”。
“信创”已成为2020年一个新风口。在国际贸易冲突和信息安全大环境下,信息技术的国产化替代势在必行。全球IT生态格局将由过去的“一极”向未来的“两级”演变,中国要逐步建立自己的 IT 底层架构和标准,形成自有开放生态。信创产业是数据安全、网络安全的基础,也是“新基建”的重要内容,将成为拉动经济发展的重要抓手之一。
杨灿群介绍:“在超算研制的过程中会产生很多副产品,如CPU、网络设备、操作系统、编译系统等,这些都是信创产业的核心基础。与此同时,超算中心不仅仅是一个计算中心,同时也是一个数据中心,可以针对信创产业的需求提供相应的技术服务,从而带动和反哺信创产业更快、更好地发展。”
在杨灿群看来,以目前的信创产业为契机,全面实现以操作系统、芯片、数据库、应用软件等为核心的国产自主安全平台,随着云计算、物联网、AI、大数据等应用,持续促进底层能力的提升,上层业务不断拓展。
信创产业作为当今形势下国内经济发展的新动能,不断拓宽着其他产业的创新边际。以超算为基础的信创产业,为众多课题提供了更多应用场景和解决方案。比如,依托天津超算中心为基础的京津冀大数据协同处理中心,推动了京津冀重大科技协同创新、区域产业发展、社会公共服务能力等领域的加速发展,目前已经初步形成了覆盖国家、区域、地方的三级政务数据支撑平台,在京津冀区域形成了面向高端装备制造、矿业、气象、能源勘探、个性化健康、大病慢病等行业大数据服务能力。
目前,京津冀大数据协同处理中心在京津区域已经服务研发机构、企业、政府部门超过1000家,自身直接经济效益超过5500万元,为企业新增经济效益超过40亿元,实现服务工业企业、医疗机构、政府部门研发效率和产品竞争力提升、培育新经济增长点、聚集国际领先的研发团队等综合成效。
数据即未来,正是基于超级计算机大数据、云计算的分析能力,信创为更多的产业带来颠覆性的变化。
在第二届世界智能大会上,由国防科技大学和国家超算天津中心共同研发的新一代百亿亿次超级计算机原型机,就已惊艳亮相。如今,天河、神威、曙光三大E级原型机已全部交付。
40年前,中国在超级计算领域还是一张白纸,一代代科研人员肩负着国家的期望和托付,艰难探索;40年后,我们的超算领域已经处于国际领先地位,而科研人员们,依旧在为梦想而拼搏、为强国而奋斗。津云新闻记者 刘畅