中国电信近日宣布,位于武汉光谷的中部智算中心已正式开始运营。据中国专家介绍,该智算中心是中国中部地区最高级别的计算设施,其在算力、安全性、环保性和可扩展性方面都达到了国际一流水平。
这台超级计算机是首次采用基于国产AI基础软硬件平台的方案架构,实现了计算、存储、网络、电力和冷却的整体设计。通过独特的嵌入式液冷单元和盲插总线架构,实现了从芯片到服务器再到机柜的全方位液冷,使得整体PUE(功率使用效率)不超过1.15,达到了业界一流的绿色节能和环保标准。
PUE是衡量数据中心能效的重要指标,它是数据中心总用电量与供应IT设备电量的比值。PUE值越低,意味着机房空调冷却时所耗的电力越少。
中部智算中心提供了千卡规模的训练推理能力,运算效率高达80%,并支持主流框架和芯片。基于训练推理的混合调度能力,资源利用率可以提升20%。
目前,中国电信已在全国建立了多个智算中心,提供了高达5,000PFLOPS的智算算力。
关于智算中心的内部结构,虽然没有太多细节,但CPU部分可能采用了兆芯开胜KH-40000服务器处理器,这款产品已在国产服务器中得到应用。另外,也可能采用龙芯32核3D5000或飞腾64核腾云S2500。这三款芯片的架构差异较大,兆芯采用了英特尔和AMD的x86架构,龙芯是基于MIPS的衍生产品,而飞腾则是基于Arm架构。
在GPU方面,可能采用了摩尔线程、龙芯和壁仞的产品。其中,摩尔线程最新推出的MTT S4000显卡已计划用于KUAE智算中心;龙芯LG200比S4000早两周推出,宣称突破了GPGPU的关键技术;壁仞BR100的性能据说远超NVIDIA的A100芯片,但由于关键合作伙伴台积电受到美国芯片法规的限制,决定暂停供货,目前BR100的生产情况尚不确定。
不论中部智算中心的实际硬件配置如何,其所有零组件均由中国制造,这显示了中国追求技术独立的雄心。虽然将西方顶尖产品替换为国产产品可能会降低一些速度,但如果能实现芯片的自给自足,美国的制裁就不会对中国产生太大影响。
原文链接:https://g.pconline.com.cn/x/1708/17082530.html