超级计算机的魔力

点赞:2729 浏览:8034 近期更新时间:2024-04-06 作者:网友分享原创网站原创

国家超级计算天津中心主任刘光明和“天河一号”超级计算机
魔法计算

1997年5月1日,世界各大媒体都在盯着一场有史以来最奇特的象棋比赛,在纽约曼哈顿一栋高楼里,对阵的双方是国际象棋大师、世界棋王卡斯帕罗夫与IBM公司生产的超级计算机“深蓝”.前者自1985年以来一直独霸棋坛,后者则是一台采用了256个内核、由一批科学家和象棋高手编程的大家伙.最后的结果令舆论哗然,计算机“深蓝”获胜.

如果说这则旧闻已经模糊,那最近的一则消息一定令人印象深刻.今年5月14日,好莱坞著名影星安吉丽娜朱莉在《纽约时报》上发表文章,已经做了切除腺的手术,因为基因检测发现她体内带有极易导致乳腺癌的缺陷基因,“87%的概率会患上乳腺癌,50%的概率会患上子宫癌”.

这两条看似毫无关联的新闻,都证明了超级计算机的用武之地.“深蓝”之所以能战胜棋王,所依靠的就是能够迅速计算出对方每一步棋路后的多种应对,并从中选择最优一招.安吉丽娜的选择,除了勇气,更多是依靠现代科学的缜密计算.如果没有超级计算机,我们无法想象该如何去计算人体基因组的30亿个碱基对.实际上,安吉丽娜并不是第一个利用基因计算来选择医疗方式的人,“苹果”创始人乔布斯也是超级计算的受益者.在检测出癌症后,他支付了几十万美元,对体内的基因进行复杂而详细的计算,以密切监视癌细胞的扩散和病变,这样医生就可以针对持续变化中的癌细胞做出快速反应,做到真正的“对症下药”.正是用这种方法,乔布斯才得以在第一次癌症手术后又延长了几年寿命.

超级计算机(Superputer),简而言之,就是能够快速处理复杂问题的超大型计算机.早期的超级计算机,干脆就叫巨型机(GiantComputer).它由成百上千万个处理器(CPU)构成,按照一定的规则进行互连,以具备超大的存储容量和超高的计算速度.传统探知世界的方法无非就是理论和实验,有了超级计算机,便增加了一种全新的方法――模拟.因为海量数据的计算可以做出更细致的模拟,人们常常把超级计算看作能够透析万物的“魔法”.

在天津滨海新区一栋不起眼的砖红色楼房中,也在上演着这样的“魔法计算”.31岁的年轻工程师菅晓东带领本刊记者推开了一楼机房的小门,震耳的轰鸣声立刻袭来,一排排黑色的机柜整齐列阵,上面不断闪烁着绿色的小灯.这里是国家超级计算天津中心,面前的这个“大家伙”就是“天河二号”的“同门师兄”――“天河一号”,也来自国防科技大学.2010年11月,“天河一号”摘取了“世界最快计算机”的桂冠,这也是中国超级计算机第一次登上TOP500榜单首位.它由140个机柜组成,每个机柜宽1.45米、深1.2米、高2米,排成13排,占地约700平方米,总重量约160吨.当年从长沙运到天津,动用了数十辆集装箱大卡车.整个机房分为三个部分,依次为存储区、通信区和计算区,联通它们的是地板之下超过100公里长的各种电线.单单是组装,就让300多人的队伍忙活了两个多月.

菅晓东向本刊记者展示正在进行中的“魔法”――一家生物制药公司正在研制一种抗癫痫药物,为了寻找对应的基因,他们先用海量的数据来建立一个虚拟的数据库,输入设定好的参数,然后通过超级计算机“天河一号”,来快速筛查出那些无效的方案,最后剩下极少数的有效选择.“如果按照传统的实验手段,需要合成数十万甚至上百万种化合物,注入小白鼠体内观察反应,一种新药的研发之所以动辄耗时十几年,就是因为实验量极其庞大.现在有了超级计算机的帮助,可以大大减少实验量,把新药的研发时间缩短到几个月甚至几周.”大学期间学习药物的菅晓东,被超级计算的魅力深深吸引,毕业后便加入了天津超算中心.

不仅是人类基因测算,超级计算机已经涉及我们生活的方方面面.迟学斌发现这个夏天北京的天气预报准确率又提高了一些,他是中科院超级计算中心的主任,之所以对天气预报敏感,就是因为这与他所从事的超算事业紧密相关.“速度是最核心的竞争力.”他向本刊记者解释道.早期天气预报之所以不够准确,很大程度上是因为对数据的计算能力不够,在有限的时间内只能计算到50~100平方公里范围,如果再进一步细化网格,可能还没等算完,大雨就下来了.现在依靠超级计算机,计算速度提高,预报范围也进一步细化,甚至能够精确到1~5平方公里.不仅如此,迟学斌进一步介绍,直到上世纪80年代末,中国气象部门的计算水平,仍然只能提前一两天,而无法完成中期(5~7天)天气预报,“还是因为计算速度不够,不能提前算完,预报就失去了意义”.超级计算机能够提供中长期天气预报,甚至能够依据海量的气候资料,模拟过去几千年的气候变化.

超级计算机的魔力参考属性评定
有关论文范文主题研究: 关于计算机的文章 大学生适用: 专科毕业论文、在职研究生论文
相关参考文献下载数量: 52 写作解决问题: 怎么写
毕业论文开题报告: 论文任务书、论文摘要 职称论文适用: 期刊发表、职称评中级
所属大学生专业类别: 怎么写 论文题目推荐度: 优秀选题

天津超算中心已经拥有几百个客户,除了政府部门、高校和科研机构外,还有很多企业用户.来自中石油东方地球物理公司的工程师武威对超算有着更切身的体会.2010年“天河一号”正式启用前一周,得到消息的武威就找上了门.武威告诉本刊记者,东方地球物理公司的主业是石油勘探,当时他们正在开发一种成像效果更好的物探软件,特意找了一块面积1050平方公里的勘探样本做数据分析.如果用自己公司的计算机集群去处理,需耗时1个月.他带着数据来到天津,第一次用了40个小时就算完了,调试之后又做了两遍实验,最后一次只用了16个小时.

速度的优势,在竞争激烈的国际市场上更为珍贵.因为超级计算机长期以来由美国等西方国家垄断,他们凭借自己的优势为国际油气田竞标设置了一项潜规则――从数据包发送到提交标书,只有1个月的时间.以往,我国的超级计算机落后,即便看中一块油田,到提交标书的时候还没有算完,剩下的部分只能凭经验和运气判断.而现在,短短几天时间就能算出上万平方公里的范围内的石油储藏资料,在做决策的时候自然有了依据和底气.

1983年12月22日,我国第一台亿次巨型计算机“银河I”在长沙由国防科技大学计算机研究所研制成功
1997年5月3日,国际象棋大师、世界棋王卡斯帕罗夫(左)在纽约与IBM公司生产的超级计算机“深蓝”对弈,最终“深蓝”获胜


与此类似,超级计算机还可以用在汽车设计中的模拟碰撞试验,用在大飞机制造中的模拟风洞试验.用天津超算中心主任刘光明的话说,超级计算机可以“算天,算地,算人”.速度竞赛

已经56岁的刘光明在超级计算机领域算得上是一员老将.1983年考进国防科技大学计算机研究所读硕士的时候,我国自行研制的第一台每秒运算速度达亿次的超级计算机“银河I”刚刚问世.这台红黄两色相间的大机柜,到现在还摆放在国防科技大学的机房里.从入校开始,刘光明就开始参与对“银河I”的改进,此后参加了所有银河系列超级计算机的研发,直到后来担任了计算机研究所的所长.2010年,“天河一号”研制成功后,主动请缨来到天津,筹建超算中心,重心从研发转向应用.他告诉本刊记者,像他这样一生都用来研究超级计算机的人还有很多,“‘天河二号’不是一下子就登上世界第一的,他是几代人花费了几十年的工夫,一点一滴拼出来的”.

如果我们把最近30年的超级计算机运算速度来画一条线,结果会发现,其上升速度远超“摩尔定律”(英特尔创始人之一戈登摩尔提出,计算机微处理器的性能每隔18个月就能翻一倍).1983年,“银河I”的运算速度只有1亿次/秒,而到了2007年,“银河V”的运算速度达到了30万亿次/秒.此后,国防科技大学跳过百万亿次级别的超算研制,直接进军千万亿次的超级计算机研制,这便是后来的“天河一号”,峰值运算速度达到4.7千万亿次/秒,持续运算速度2.57千万亿次/秒.

现在,短短两年之后,“天河二号”又把这一速度远远甩在了身后.不久前,在一次长达5个小时的标准测试中,“天河二号”跑出了峰值54.9千万亿次/秒、持续计算速度33.9千万亿次/秒的成绩,比“天河一号”又快了十几倍.更令人惊讶的是,跑出这样的速度,“天河二号”并没有用足全部力气,它只使用了自身所携带的1.6万个运算节点当中的1.4336万个,相当于只用了90%的劲儿,就比排在第二位的美国“泰坦”超级计算机快出了74%.

速度的竞争越来越激烈,在超级计算机排行榜上也呈现出胶着状态.1997年,“银河Ⅲ”超级计算机第一次参与TOP500组织的全球排名,结果排在了501位,尚未进入大名单;到2000年的时候,“银河Ⅳ”已经排到了全球第20名,标志着中国进入了世界级的超级计算机俱乐部,终于在10年之后的2010年凭借“天河一号”问鼎.也是在这十几年间,TOP500的前十名中,美国独领的局面被打破,日本、德国等国家纷纷上榜,尤其美、日、中三国相互之间竞争更加白热化.

2010年底,“天河一号”夺得世界第一后,日本在遭受“311”大地震灾害的情况下,仍投资10亿美元加快研制超级计算机“京”(KComputer),并于2011年6月夺取世界第一.不过,“京”的优势只持续了一年,2012年6月即被美国IBM公司研制的“红杉”超级计算机超越.又过了半年,美国能源部橡树岭实验室的超级计算机“泰坦”登上了世界第一的位子.但是,从数量上看,美国仍然保持着世界超级计算机最大的规模,在刚刚公布的TOP500名单中,美国拥有其中的253个,中国大陆拥有65个,日本则占据了30个.

“速度竞赛的背后是综合国力的比拼,超级计算机不仅仅意味着一国的科研能力,反过来又可以帮助我们提升自己的综合国力,提升科研、经济、国防、社会管理等各个领域的竞争力.”迟学斌向本刊记者分析道,超级计算机与航空航天事业类似,是一个国家综合实力的“镜子”与“助推器”.

超级计算机是一项庞大而复杂的系统工程.为了解决速度问题,它并不是简单地将普通计算机叠加在一起就能实现的.CPU是计算机中用来处理数据的核心部件.迟学斌向本刊记者介绍,按照传统的思路,科学家们一直在努力提高单个CPU的性能,通常有两种方式――提高主频或者增加核数.但是,前者会导致能耗大幅提高,后者又会遇到“天花板”,毕竟一个CPU上能承载的核是有限的.“核”是CPU上用来处理数据的芯片组,它的数量直接决定了一台电脑的数据处理速度,普通的家用电脑大多采用双核处理器,即便是我国自主研发的高性能处理器“飞腾1500CPU”,也只有16个核.

“‘天河一号’的第一大创新,就是打破了传统思路,创造性地运用自主研发的高速互连模式,在工程上实现了CPU+GPU的异构融合.”参与研制的刘光明告诉本刊记者.通俗来讲,就是将数据处理器与图形处理器相结合,用一种高速互连的方式把它们连接起来,从而在运算过程中剔除掉一些不必要的逻辑运算,节省相互之间的通信时间,提高计算速度.“天河二号”沿袭了这一模式,它拥有1.6万个计算节点,每个节点上部署了5个处理器,每个处理器又拥有数量不等的核,总计有312万个计算核心.若以人工1次/秒来类比,“天河二号”运算1小时的数据量,中国13亿人口需要计算1000年.

为了与超快的计算相匹配,超级计算机还必须拥有超大的存储容量.在美国计算机历史博物馆里,陈列着一个27公斤重的硬盘,却只能够存储5M的容量,而现在,一个普通家用的硬盘就能达到1TG的存储量,是它的20万倍.“天河二号”由170个机柜组成,内存总容量1400万亿字节,存储总容量12400万亿字节,相当于存储每册10万字的图书600亿册,容得下4个国家图书馆的藏书.庞大的存储量和超快的计算速度,背后所付出的代价就是惊人的耗电量.“天河二号”的最高运行功率是17.8兆瓦/小时,意味着如果满负荷运转每小时的耗电量将高达1.78万度,相当于5所大学的耗电量之和.因此,散热制冷和供电保障成为超算中心的重头戏.天津超算中心的监控室里,4个屏幕上显示着电路和冷却塔的工作状态,工作人员必须24小时值守,一年来也只有春节检测期那几天才可以停机检修.

2011年6月,日本研制的超级计算机“京”,在全球超级计算机500强排行榜中夺得第一
超算之路

“‘天河一号’排名世界第一的时候,我很欣喜,而这一次的心情完全不同.‘金榜题名’固然是好事,但兴奋之余我们感到更多责任,需要对未来发展进行更深入的思考.”“天河二号”计算机系统研制工程副总指挥李楠在采访时说出的这句话意味深长.时隔两年,中国超级计算机重回“世界第一”,但这并不意味着中国的超算水平也达到了世界第一.“超级计算机计算就好比是高速公路,我们现在有了更宽更好的路,但在上面跑什么样的车,如何去管理和运行,则是更艰巨的任务.”刘光明告诉本刊记者.

与美国相比,中国的超算事业起步较晚.1975年10月和1977年秋,时任国防科工委主任的张爱萍上将先后两次指示国防科技大学计算机研究所对巨型机(当时还未叫超级计算机)研制进行调研.1978年3月,军委主席专门听取了关于计算机发展情况的汇报,明确由国防科工委系统承担亿次机研制任务,张爱萍将军为其命名“银河”.

早期的超级计算机,主要应用在国防领域,尤其随着1996年《全面禁止核试验条约》的签署,世界核大国陆续停止了核试验,利用超级计算机进行模拟核试验便成为新的代替方式.不仅如此,走在前列的美国还依靠超级计算机系统来管理它庞大的库.随着超算技术的成熟,逐步推广至国民经济的方方面面,但是,美国等发达国家对超级计算机的技术实行严格保护.刘光明还记得,上世纪80年代,“银河Ⅱ”研制的时候,中国气象局想从美国购写一台超级计算机,从事中期天气预报的计算.可美国人先是不卖,后来又提出很多苛刻的条件,比如限制计算数据的量,甚至提出建一所玻璃机房,只允许美方人员进入操作计算机.就是在这样的夹缝中,国防科技大学自主研制成功了“银河Ⅱ”,当这一机器发布后,美国人眼看自己的优势不再,很快就答应卖给中国一台.当时,在中国气象局有两台超级计算机相邻而放,从运行情况看,“银河Ⅱ”并不输美国的同类型计算机.

2010年11月16日,在美国新奥尔良举行的全球超级计算机500强排行榜颁奖仪式上,“天河一号”夺得世界第一.图为刘光明接受获奖证书

研制超级计算机,不仅仅需要科研实力,还需要强大的经济实力.迟学斌告诉本刊记者:“超级计算机这样的前沿科技,投入产出肯定不成正比,某种意义上,也是一个烧钱俱乐部.”在美国,基本靠联邦政府的财政拨款,由国家实验室来负责研制,完成后免费向政府机构和科研机构开放使用.中国走了一条多方合作的模式,前期研发经费由与地方财政承担,后期运营则面向企业开放,收取一定的费用.

刘光明向本刊记者介绍,“天河一号”所在的天津超算中心共耗资约5亿元,其中由天津开发区支持基础设施配套近1亿元,由拨款2亿元,天津滨海新区配套2亿元,共5亿元交给国防科技大学用于机器研制.到了“天河二号”机,地方上的配套比例进一步提高.据广州市领导透露,依托于“天河二号”的广州超算中心,总耗资接近20亿元,其中光机器的研制就要超过10亿元.由科技部拨付财政6亿元,广东省配套6亿元,广州市再配套6亿元.

“经过几十年的积累,我国的科技实力和经济实力已经允许我们进行这样的前沿研究,不能计较眼前的回报,科学研究应该指向未来.”迟学斌深有感触.中科院的超算中心配备了一台“深腾”超级计算机,每年光电费就高达1100万元.除了供中科院内部研究机构使用,它还为的指纹比对系统提供计算支持.“我记得大概五六年前,我们刚合作的时候,指纹数据库里只有一两百万个样本,现在则有近2000万个,数据采集越多,对计算速度的要求就越高.”迟学斌说,“现在通过指纹筛选锁定犯罪嫌疑人已经成为破案的利器,超级计算机所贡献的社会效益远远大于经济回报.”刘光明介绍说,即便是国内运用情况最好的天津超算中心,每年的运行成本也要3000万元,其中市场合同收回2000万元左右,尚需政府补贴1000万元.

比成本更亟待解决的问题,还是应用.此次“天河二号”超级计算机所用的CPU中,国产的“飞腾1500”只占到1/8.副总指挥李楠在接受采访时解释说,并非因为国产CPU性能不够,而是因为受制于软件.“目前我国大多数大型应用软件都是从国外引进的,只能在国际商用CPU上运行.如果全部使用国产CPU,打造出来的将是一个专用型机器,只能用于天气预报等我国拥有自主知识产权应用软件的行业.”为了保证机器的广泛适用性,只能大量使用国际商用的CPU.迟学斌也向本刊记者强调:“计算的前提是海量数据的采集和理论储备,如果没有理论和方法的研究,就没有自主开发的软件,超级计算机就容易成为摆设.”

这也是摆在刘光明面前的最大挑战.天津超算中心已经成为当地一个固定的“参观景点”,每天都有政府部门、科研院校的人来参观,但基本都是去机房拍两张照片就走,看看热闹而已.“我们对超级计算机的认识和运用还差得很远.”作为超级计算机的研制者,他有时候又感到很无奈和遗憾.“现在我们生物制药领域的客户,都是国外客户,还没有国内的制药企业肯沉下来投入两三年来研发新药.”

两年前,“天河一号”获得世界第一的时候就是他代表研制单位去美国领的奖,当时,国际上对中国这批超算“黑马”都很惊讶,刘光明却很坦然,他告诉那些疑惑的外国专家:“一个国家、一个团队,用近30年的时间,没日没夜地干一件事,每年只有春节的时候休息两三天,最终做到世界第一,并不奇怪.”但是,他很清楚,未来的应用,如何让超级计算机真正发挥它的魔力,还需要更长久的努力和积累.