集微网消息,美国AI芯片初创公司Cerebras Systems于7月20日宣布,已经与阿联酋集团G42签署了一项金额约1亿美元的协议,将为其交付至多9台CG系列(Condor Galaxy)AI超级计算机,今年将交付第一台CG-1,性能可达4 ExaFLOPs(FP16)。
随着人工智能的兴起,英伟达的GPU供不应求,世界各地的云计算公司都在寻求英伟达的替代品。而Cerebras公司此前发布了目前“世界最大的”人工智能芯片Cerebras Wafer Scale Engine(WSE-2),其基于一整片12英寸晶圆制造,面积462.25平方厘米,采用台积电7nm制程,晶体管数量多达2.6万亿个。
WSE-2拥有85万个人工智能内核,片上集成40GB SRAM缓存,带宽20 PB/s。深度学习需要神经网络各层之间巨大的通信带宽,WSE芯片采用高带宽、低延迟通信结构,提供高达220 Pb/s的处理器-处理器互联带宽,是传统GPU的4.5万倍以上。
基于WSE-2打造的计算节点名为CS-2,该产品的尺寸为15 RU,峰值功率23千瓦,官方表示这款服务器的效率优于传统AI GPU服务器,每台机器的运算性能相当于10-100个传统节点。
目前已推出的Condor Galaxy 1 AI超级计算机系统(CG-1),包含64个CS-2节点(包含5400万个AI计算核心)、72704个AMD EPYC 3代处理器核心、82TB内存,这一系统的运算能力可达4 ExaFLOPs(FP16)。目前这一超算已经训练了多个大语言模型,涵盖阿拉伯语在内的多个全新数据集。此外,这款超算也能够通过云服务方式服务客户。
Cerebras公司表示,G42已经同意购买三套Condor Galaxy(CG系列)超算系统。该产品将在美国建造,第一套CG-1预计将于2023年投入使用,另外两套CG-2、CG-3将于2024年初投入使用。两家公司未来还将洽谈于2024年底再购买6套超级计算机的事宜,这样可以使得总计算能力达到36 ExaFLOPs。
(校对/赵月)
原文链接:https://laoyaoba.com/n/869962