当前位置：首页 » AI资讯

成本降低12倍！英伟达升级版大模型芯片明年投产，黄仁勋：AIGC时代来了

2023-08-09

247

美国AI(人工智能)芯片巨头英伟达发布数据中心领域重磅芯片，剑指竞争对手AMD。

当地时间8月8日，英伟达(NVDA.US)CEO黄仁勋身穿经典皮衣，在计算机图形学顶会SIGGRAPH 2023现场发布新一代GH200 Grace Hopper超级芯片，并宣布将在2024年第二季度投入生产。GH200专为人工智能大模型设计，用于扩展全球的数据中心。

黄仁勋表示，生成式AI(AIGC)时代来临，英伟达将继续大力推动生成式AI发展的决心。

《华尔街日报》指出，这是英伟达对于AI数据中心芯片市场最大竞争对手AMD的“反击”，英伟达此前就已经预告将发布与AMD的Insight MI300X CPU + GPU对打的产品，后者是今年6月AMD刚刚发布的大模型专用芯片。

GH200超级芯片将于明年投入生产，较H100更强

GH200全球首发采用HBM3e高带宽内存，与英伟达目前最高端的AI芯片H100使用同样的GPU，但不同之处在于，GH200将同时配备高达141G的内存和72核ARM中央处理器，每秒5TB带宽。和现有Grace Hopper型号相比，最新版本的GH200超级芯片能够提供3.5倍以上的内存容量和3倍以上的带宽。和H100相比，GH200超级芯片的内存增加了1.7倍，带宽增加了1.5倍。全新一代的GH200预计明年二季度开始生产。

黄仁勋表示，一台服务器可以同时装载两个GH200超级芯片，大型语言模型的推理成本将会大幅降低。

据介绍，投资800万美元Grace Hopper，就相当于8800个价值1亿美元的x86 GPU，意味着成本降低12倍，能耗降低20倍。

GH200专为加速计算和生成式AI时代而打造，以巩固英伟达在AI界的主导地位，应对其老对手AMD于6月推出的数据中心APU(加速处理器)Instinct MI300系列的更新。

更厉害的地方在于，在内存和运算能力得到大幅度提升的基础上，GH200超级芯片还可以基于NVLink技术继续拓展互连，让GPU有能力访问全部的CPU内存，帮助客户减少机器数量并更快地完成工作。为了突出产品的这一特性，黄仁勋在演讲中屡次幽默地重复自己的口头禅：“你买得越多，就省得越多(The more you buy, the more you save)。”

“任何人都可以成为程序员”

在本次演讲中，生成式AI成为了被黄仁勋挂在嘴边的一大关键词。他在演讲中展示了图像和AI之间的不可分割性，表示AI既能够在虚拟世界中学习，也能够帮助搭建虚拟世界。

“大型语言模型是一个新的计算平台……人类就是新的编程语言，我们已经使计算机科学民主化，现在任何人都可以成为程序员，”黄仁勋在会议上说道，“时隔15年左右，终于有新的计算平台出现了，计算机本身必然会以截然不同的方式处理信息。”

美国科技媒体TechCrunch评价道，作为一款最新的、专门面向数据中心的AI开发硬件，在性价比高且耗能低的GH200即将推出的当下，再花费数百万美元为CPU机架等上一代计算资源进行投资研发将成为一种愚蠢的行为。虽然黄仁勋并未在演讲中提及AI目前面临的许多挑战、监管乃至概念上的变化，但他为观众展现了一个属于AI的积极前景。

英伟达的工作站GPU(图形处理芯片)系列也借本次发布会全面上新，一口气推出了4款新品：RTX 6000、RTX 5000、RTX 4500和RTX 4000。其中，性能最强的RTX 6000具有48GB的显存，18176个CUDA核心，568个Tensor核心，142个RT核心，和高达960GB/s的带宽。

针对企业客户，英伟达还为RTX 6000推出了最新的一站式解决方案RTX工作站。新的RTX工作站由英伟达和BOXX、戴尔科技、惠普和联想合作推出，支持最多4张RTX 6000 GPU，可以在15小时内完成8.6亿token(文本中的最小单位，一个单词或一个标点符号)的GPT3-40B的微调。

第三方开发者平台接入AI超算服务

对于开发者而言，英伟达将发布的全新统一工作空间是一个值得关注的话题。该空间被命名为NVIDIA AI Workbench，能够为开发者提供一个统一、易用的工作空间，使他们有能力在个人电脑或工作站上快速创建、测试和微调生成式 AI 模型，然后将这些模型扩展到几乎所有数据中心、公有云或 DGX Cloud。

OpenUSD的开发也是本次演讲中的重点内容。就在本次演讲一周前的8月1日，美国3D内容行业的5家主要公司苹果、英伟达、皮克斯、Adobe和Autodesk联合成立了OpenUSD联盟(AOUSD)。OpenUSD技术是英伟达Omniverse平台的基础，可能会成为未来“元宇宙”的3D图形标准。

黄仁勋在演讲中宣布了英伟达 Omniverse 平台的重要更新，将为开发者、企业和行业带来新的基础应用和服务，使他们能够使用OpenUSD 框架和生成式AI优化改进3D流程。

另外，英伟达将发布四款全新Omniverse Cloud API，包括RunUSD、ChatUSD、 DeepSearch 和 USD-GDN Publisher，使开发者能够更加流畅地实施和部署 OpenUSD流程和应用。

合作伙伴方面，英伟达正在与人工智能初创公司Hugging Face展开合作，将支持Hugging Face名为“作为服务的聚类训练(Training Cluster as a Service)”的项目，简化企业创建新生成式AI模型的过程，这也意味着开发人员可以在Hugging Face平台上直接使用英伟达的超算服务。

5月25日，英伟达发布截至4月30日的2024财年第一季度财报，收入为71.9亿美元，高于市场预期的65.2亿美元，与上年同期的82.88亿美元相比下降13%，与上一财季的60.51亿美元相比增长19%。

Wind数据显示，英伟达2023年迄今的涨幅达到205.71%。或许是受到美股大盘集体走弱影响，英伟达美东时间8月8日股价低开低走，收跌1.66%，报446.64美元，总市值1.10万亿美元。英伟达将于太平洋时间8月23日(北京时间8月24日凌晨)发布截至2023年7月30日的2024财年第二财季财报。

(责任编辑：王晨曦)

原文链接：http://finance.china.com.cn/industry/20230809/6019105.shtml

人工智能黄仁勋

声明：本站内容均来自互联网，归原创作者所有，如有侵权必删除。本站文章皆由CC-4.0协议发布，如无来源则为原创，转载请注明出处。
小默AI工具导航网 » 成本降低12倍！英伟达升级版大模型芯片明年投产，黄仁勋：AIGC时代来了

成本降低12倍！英伟达升级版大模型芯片明年投产，黄仁勋：AIGC时代来了

相关推荐

评论 ( 0 )

取消回复

AIGC

AI聊天

AI文章工具

实用工具

阅读榜

点击榜

热门标签

成本降低12倍！英伟达升级版大模型芯片明年投产，黄仁勋：AIGC时代来了

相关推荐

评论 ( 0 )

取消回复

AIGC

AI聊天

AI文章工具

实用工具

阅读榜

点击榜

小默AI工具导航网-1000+AI工具导航