|
发表于 2013-6-17 18:07:02
|
显示全部楼层
直指超算TOP1 天河2号超级计算机解读
2013年06月03日14:42 来源:eNet硅谷动力
【文章摘要】天河2将会由1600个浪潮的节点组成,每个节点有2颗基于Ive Bridge处理器和3个Xeon Phi,累计共有32000颗Ive Bridge处理器和48000个Xeon Phi,总计有312万个计算核心。
计算节点的前端处理器为4096个FT-1500处理器, FT-1500处理器是由国防科技大学为天河1研发,其可以说是天河1项目的最大收获,其为16核心的Sparc V9架构处理器,在40nm工艺情况下运行频率为1.8Ghz,峰值性能为144 Fflops/s,功耗为65W,但相比英特尔22nm 12核 2.2GHz 211Gflops/s性能的Ive Bridge还是有明显差距。
天河2互联方面采用自主研发的 Express-2 内部互联网络,其为有13个交换机,而每个交换机有576个端口。连接介质为光电混合。
而在计算能力方面,使用14336个节点 总计50GB内存进行LINPACK测试,理论性能为49.19Pflops,而实际测试性能为30.65Pflops,效率为62.3%。这个效率并不算高,还有很大优化提升潜力。当然也可能是被Xeon phi仅支持PCI Express 2.0带宽不足限制。
每个Xeon Phi使用其中的57个核心,而不是使用全部的61个,因为使用61个在运算周期协调方面会有问题,而使用57个核心能够加速4个执行线程,并且在每个线程单周期可以达成4flops的运算量,运行在1.1GHz的Xeon Phi可以生产1003 Tflops的双精度运算能力。如果考虑CPU,2 Ivy Bridge * 0.2112 Tflop/s + 3 Xeon Phi * 1.003 Tflop/s=3.431 Tflops,2个Ive Bridge+3个Xeon Phi单个节点可以有3.431 Tflops运算能力,16000个节点总计可达54.9PFlops性能。每个运算节点有64GB主存、而每个Xeon Phi板载8GB内存,因此每个节点共有88GB内存,总计16000个节点一共有1.404 PB内存,而外部存储器容量方面更是高达12.4PB。
天河2的性能部件(处理器、内存、互联)整体功耗为17.6MW,而整体的运算能力为30.65PFlops,这样计算每瓦的性能为1.935Gflops,这个性能/功耗比可以拍在超算TOP500的前五,其整体性能/功耗比十分出色。
天河2虽然并不是最早采用英特尔Xeon Phi的超级计算机,但其却对Xeon Phi却有至关重要的意义,天河2号对于Xeon phi的采用使得其在与Tesla的竞争中稳稳占到上风,并给予Tesla KO般的致命一击。天河2号的意义不仅在于登顶超算排行TOP1,相比天河1和其他基于GPU的异构超级计算机,其在应用范围上更广、整体效率更高,相比在浮点计算精度、分支预测存在天生缺陷的GPU异构计算有更大的实用价值。天河2采用Xeon Phi,可以说代表HPC并行计算到达新的层次,迎来Xeon Phi并行计算的新时代,同时也预示着以NVIDIA Tesla为代表的GPU异构超算逐渐走向死路末途。
http://www.enet.com.cn/article/2013/0603/A20130603288413.shtml
说白了就是INTEL至强CPU和Xeon Phi的强强联合,这算是今年INTEL最威风的广告了 |
|