说到高性能计算,曙光绝对是国内厂商里比较擅长此道的一个。就在6月27日,国内最快的超级计算机曙光5000A签约上海超级计算机中心,而在此前九天,超级计算Top500榜单发布,错过了上半年榜单的曙光是否感到遗憾?对于曙光5000A的表现,曙光又有什么话想说?
或许是为了解开这些困惑,曙光携手AMD在22日下午召开了曙光5000A高效能计算机研讨会。速度不再是宣传的重点,“高效能”或许更贴近目前高性能计算领域的热点。
曙光5000A部分技术细节
曙光5000A整个系统当中最重要的是基于刀片服务器架构的超并行处理系统,用研讨会的主讲人曙光副总裁聂华先生的话来说,这是最最核心的计算单元。整个刀片系统全面采用自主的刀片设计,7U的架构,每片集成了4路SMP的CPU这样的高密度设计,也走到了密度设计的前列。
曙光新的四路AMD全新计算刀片,充分利用了空间,光了CPU内存占到3/4的空间,变成了非常高密度的设计。整个构建之后,变成了常见的1U服务器密度2.86倍。支持4颗全新64位Barcelona 4Core处理器。这可以更大的规模来解决整个工程计算当中的规模,如果用高速网连接的话,效率会整个降低。对于很多应用来讲,光一项设计就可以提供十几倍的计算性能提高。
在网络互联方面,曙光5000A采用了模块化的设计。这块模块的集成有很多的好处,包括对可靠性提升、结构性的各个方面的提升里面网络、管理都是冗余的,给客户增加了提升的空间。
慢慢浮出的高效能概念
聂总详细介绍了曙光5000A的“四高两低”,高性能是指设计高峰值230TFlops,设计Iinpack大于160T,效率大于70%。CPU大于30000Cores,内存大于120TB。高性能是最高性能的体现,或者机器规模的体现。而高效能这个最近在高性能计算学术界比较热门的词汇在英文里跟高生产率是一个概念。聂总解释说,机器不光是高效能,但能不能以一种非常高的生产率提供服务,这就进入了高效能概念。
“这里就举个例子,我们很容易用3万台CP搭建起机器,也可以进行比较高值的峰值运算,但不是高效能计算机,因为它对于解决用户问题的规模不多,一旦遇到耦合度比较大的应用,这种系统运行可能就瘫痪了。我们为什么专门做了4路计算刀片。2路是非常成熟的,但不是高效能的做法。我们用的是4路、8路的胖节点,我们的设计适用性和应用度大幅度得到提高。这里高效能更多的是高生产率的概念,包括CPU直连访问内存技术,这项英特尔既然转向技术,网络设计有实际意义,可以让刀片单CPU核接内存寻址64GB。胖节点单CPU核直接内存寻址128GB,这就满足我们特殊行业应用的挑战性需求。我们的互连网络从延迟可以看到,已经形成了国内很少见到的低延迟,这个低延迟技术是07年年度芯片才成熟,现在对我们系统的设计非常好。这都是我们系统实现的高生产率的指标。”聂总进一步介绍说。
更关注系统配套而非单纯性能
而在比较敏感的关于曙光5000A所使用的CPU问题上,到场的AMD中国区高级技术经理刘文卓先生首先给出了自己的看法,“巴塞罗那每个核心可以对于高性能运算来讲,像曙光4000A有80%的使用率。另外本身的低功耗,在业界来说曙光是非常先进的。另外内存一直是AMD和英特尔路线不同的地方。”
聂华表示,曙光认为英特尔和AMD的产品都非常优秀,但是整个产品设计的初衷是高效能计算机,四路SMP和双路SMP不是同等技术的产品。而在四路上,英特尔并不是很理想的架构,而AMD是非常理想的。这种节点的SMP,同时也降低了系统的规模,增长了节能稳定性的一系列问题。同时曙光发现直连内存技术是下一个发展潮流。
在对待没有参加Top500上半年评比的问题上,聂总显得非常自信。他表示,对于高性能计算机来讲,用户角度来讲排名不重要,厂商角度来讲排名很重要,排名代表能力、技术水准。但从应用角度讲,它应用的领域和排名的领域其实截然不同,比如排名是全系统的整合能力。从用户应用来讲,大量应用并不是全系统统一的,这种应用对用户各个角度来讲,如果大家长期关注,很多人知道是有结论的,只是苦于没有更好的指标,大家还在沿用。曙光由于用低功耗CPU实现了20%的计算性能,其实CPU比英特尔又牺牲了很多的性能。但增加的高生产率的部分,包括2路变4路,并没有在规模上体现出来,但从用户的应用和效能设计角度讲,曙光依然在做。
他开玩笑说如果采用英特尔CPU,上半年排名早出来了,但是曙光必须看到用户实际应用的效果才会参加评选。
在介绍中我们看到5000A的系统中预留了协处理器,但是整个系统当中为什么这次没有选择协处理器?聂总称这个是和用户的应用环境密切相关的,上海超算的特点是全世界最大的通用计算平台,国外的高性能计算机有一个特点,一个高性能计算机做哪一项应用就做哪一项应用。但上海超算不同,全国只要是高性能计算的项目,都要拿到这个平台上计算。这种情况下,对于用户来讲,不能全插上加速卡,因为付出投入产出比是不够的。
所以针对上海超算曙光将5000A做成通用计算平台,所以要选用通用CPU、通用架构,对用户才最有价值、最有意义。不过,到了千万亿次计算,聂华表示,如果用户还是上海超算,这种局面也改变不了,如果不是上海超算,而是面向某一类应用的客户群,这样专用的协处理器技术就会大面积应用。但即便是上海超算里,也构建了少量节点。
“对于我们现在的加速卡,也要少量的布置一些。千万亿次计算机来讲,我很乐观的看,从现在的进展看,如果用户是定向到某一类用户,我们在特定应用也能获得非常好的实际应用。”言谈之间透出了对5000A的信心。
加速国内高性能计算发展
提到高性能计算,又提到了Top500,不禁让人又再次比较起国内外高性能计算的现状。聂华表示,国内的高性能计算发展头很多因素,其中一个比较重要的是国家。国家的科技计划的十五、十一五一般都是五年,五年、五年之间肯定有断档。另外高性能计算机如果在算给用户创造价值,就是一个聚宝盆、摇钱树,但如果不创造价值的情况下,很多用户就会觉得天天想这些机器造成的字眼消耗,这就是一个吃钱的机器。
高性能计算机这种特点决定了它的发展不是一台机器的发展,也不是一件硬件机器的发展,是牵扯到软件配套。其实国内真正开并行计算的大学很少,在国内进行并行计算很少,软件成熟相对比较滞后。但是现在国内高性能计算的加速度很快,也给了曙光很多机会,比如核武器、航天宇宙飞船、气侯变化的分析、造车、造船、造桥,这些计算又刺激了高性能计算的需求。
第二个因素是高性能计算机和高性能应用之间的匹配问题。过去高性能计算应用相对比较弱,但现在成熟加速很快。第三块是说现在也具备了两者一起结合向上发展,比如上海超算,已经具备了高性能计算的爆发需求。这种背景下,看到高性能计算的发展才能体现出来。聂华解释说,如果我们明天造出千万亿次,还要停留在找用户,那就不能出现在排行里。目前要做的是找到很好的平衡点。最乐观的消息是什么?是对CPU厂商的多核及一定程度上刺激了并行计算的发展,在一个侧面起到了作用,马上12核都出来了,8核的样品也有了,怎么让一个CPU用到这些核。这个基础打好了,可以大大的激发高性能计算机的发展。
在高性能计算领域,现在已经有了非常激烈的竞争。无论是争取更高的排名还是选择更合适的系统,其实都是建立在用户满意的基础上,如何将更好的技术与应用结合在一起,或许是我们更应该关注的问题。但是无论如何,曙光让我们对国内高性能计算的发展有了更强的信心。
进入讨论组讨论。相关专题
- (11次浏览)四核四路高端机!惠普DL580 G5售价5万2
- (5次浏览)够用好用 惠普主流塔式ML350 G5售12200
- (5次浏览)部署服务器集群!IBM X3550售价13800元
- (3次浏览)4块SAS不涨价!戴尔塔式PE 2900送优盘
- (3次浏览)优秀设计稳健表现 IBM x3650售价15500
- (2次浏览)雅虎能否成为微软救命稻草?
- (2次浏览)45nm国产机架!亿时空SX1244-R不足8千
- (2次浏览)支持AMD 华硕推出高端工作站主板
- (2次浏览)网络服务助科学家从预测蛋白质到理论生命
- (2次浏览)惠普AMD四核巴塞罗那服务器DL385 G5评测






