近日,全球科技巨头纷纷下场卷向AI芯片赛道。
ChatGPT的开发者OpenAI正探索自研AI芯片,同时开始评估潜在的收购目标、进行AI硬件开发等相关岗位的招聘。
软件和云服务巨头微软从2019年开始研发代号“雅典娜”的芯片,并将在今年11月推出首款AI芯片。
日前,在美国圣何塞举行的Intel On技术创新大会上,英特尔CEO 基辛格披露将在明年推出5nm AI 芯片Gaudi 3。
同时包括谷歌、亚马逊AWS、阿里巴巴、百度、华为等云服务大厂都已有自研AI 芯片用于数据中心,Facebook母公司Meta也有相关计划。
在半导体这场波谲云诡的竞争中,这些巨头为何纷纷剑指AI芯片呢?AI芯片当下的发展挑战和破局方向又在哪里呢?
01AI芯片市场风云Maket Situation
作为引领新一轮科技革命和产业变革的战略性技术,人工智能(artificial intelligence,AI)正加速发展,人工智能应用场景加速涌现。
人工智能的发展主要依赖两个领域的创新和演进:一是模仿人脑建立起来的数学模型和算法,其次是AI芯片。
通常意义上的AI芯片指的是针对人工智能算法做了特殊加速设计的芯片,但从广义上讲只要能够运行人工智能算法的芯片都叫作AI芯片。
CPU和传统计算架构无法满足对于并行计算能力的需求,需要特殊定制的芯片。在执行智能处理任务时,AI芯片的性能是普通芯片的百倍,而且能耗更低,能够为人工智能技术的应用和实现提供强有力的计算基础。
AI芯片主要有两大功能:训练和推理。
功能 | 释义 | 对AI芯片的性能要求 |
训练 | 学习大量数据并形成具有特定功能的神经网络模型 | 高算力、高容量和访问速率、高传输速率、通用性 |
推理 | 利用已经训练好的模型,通过计算对输入的数据得到各种结论 | 算力功耗比、时延、价格成本的综合能力 |
从技术架构来看,AI芯片行业的主流技术路线主要分为GPU(图形处理器)、FPGA(现场可编程逻辑门阵列)、ASIC(专用集成电路)三大类。
当前全球AI芯片市场,中高端云端芯片基本被欧美日韩地区垄断。国内主要集中在终端ASIC芯片,虽然在某些领域处于世界前列,但多为初创企业,尚未形成有影响力的“芯片-平台-应用”的生态体系,与英伟达、赛灵思等传统芯片巨头抗衡方面尚欠实力。此外,在GPU和FPGA领域,中国仍处于追赶状态,高端芯片则依赖进口。
在数据中心AI加速市场上,2022年英伟达的市场份额达到了82%,亚马逊AWS和赛灵思分别占比8%和4%,而AMD、英特尔和谷歌的市场份额均为2%。
可以说,目前面向服务器的AI芯片市场处于英伟达的统治之下,英伟达GPU成为许多AI公司的唯一选择。
特别是自去年年底以来,生成式AI热潮兴起之下,英伟达的AI芯片便持续供不应求,价格也是水涨船高。这也在一定程度上制约了生成式AI技术的持续加速发展。
在应用端,据AMD预计,2027年全球数据中心AI计算市场规模将超过1500亿美元。伯恩斯坦分析师斯泰西•拉斯贡分析显示,ChatGPT每次查询大约花费4美分。如果ChatGPT的搜索量增长到谷歌搜索量的十分之一,每年将需要大约价值481亿美元的GPU以及价值约160亿美元的芯片来维持运行。
因此,自研AI芯片不仅可以大幅度降低成本,减少对英伟达的依赖,还意味着可以瓜分这块巨大的“蛋糕”。
自研芯片是一项重大的战略举措,同时也需要巨额的投资,每年的成本可能高达数亿美元,即使投入了大量资源也并不能保证成功。
02关键挑战和破局方向
Challenge & Direction
AI芯片的重要指标是算力和带宽。算力是一秒钟所能完成的处理数据的数量,决定了AI芯片的数据计算速度;带宽则决定了AI芯片每秒钟可以访问的数据量。当前AI芯片主要面临以下三个技术挑战:
- 性能功耗比控制
AI芯片的核心可以理解为一个快速计算乘法和加法的计算器。大量运算会造成功耗大幅增加。很多AI应用端对于功耗都有严格的限制,如何达到优异的性能功耗比是AI芯片研发的一个重要目标。
- 带宽瓶颈
深度学习算法中参与计算的数据和模型参数很多,数据量庞大,导致内存带宽成为了整个系统的一个瓶颈,“Memory Wall”也是需要优化和突破的主要问题。
- 软件开发
除了芯片本身硬件的设计以外,软件对于AI芯片性能的发挥也有着十分重要的作用,编译器和工具链软件的优化能力、易用性现在也得到越来越多的重视。
人工智能与AI芯片技术为中国市场这几十年来埋头追赶的芯片行业打开了一扇新大门,让我国第一次拥有从追赶到引领的机会窗口。在动辄融资上亿美元融资的催化之下,中国市场AI芯片创业市场尤为兴盛。
但同时,与发达国家与地区相比,我国大陆地区芯片制造工艺差距不小,产业发展依旧存在自主创新能力弱、关键核心技术对外依存度高、人才缺乏等问题。
如何抓住这次机遇,走出一条与先进工艺弱相关的AI芯片自主创新与战略突围之路?
目前我们正处于第三次人工智能浪潮,它一个重要特点是从人使用计算机变成机器使用计算机。
清华大学教授、国际欧亚科学院院士魏少军教授认为,“通用”仍然是人工智能芯片的主流架构,然而此通用非彼通用,未来的通用人工智能芯片,需要在通用的基础上,变得更加“智能”,以满足各种各样终端应用的定制化需求。
“实现智能的核心是软件,支撑智能的基础是芯片(硬件)。”魏少军教授在英特尔2023中国学术峰会上如是说道。
基于软件可编程性和硬件可编程性,魏少军教授将这两者构成AI芯片的坐标体系。处理器放在第二象限,专用集成电路放在第三象限,FPGA放在第四象限。而第一象限,即是具备软件和硬件的双可编程性,通过软件和硬件之间的有机融合,来用软件定义芯片,也叫作可重构计算芯片。
在硬件结构方面,需要考虑如何将软件转换为一个可以与硬件结构匹配的大小分块。当硬件架构运行时,软件与硬件将实现映射,硬件功能不断根据软件编程结果的变化而发生变化。由此获得一个具备软件和硬件的双可编程性的智能架构芯片。
目前,我国在“软件定义芯片”的方向上做的比较好,实现了芯片架构和功能的纳秒级重构,使硬件电路可随软件算法的变化而快速变化,在确保灵活性的同时,大幅提升能量效率。
在未来漫长的历史长河中,芯片的发展历程显得尤为短暂和迅速。人类可以接受教育、学习和成长,但芯片在出厂后就无法在物理上实现进步。在AI完全“智能化”的发展中,我们一个重要的任务就是提高芯片“自学能力”,如同人类接受教育一样,通过智能软件赋予硬件持续迭代的能力,使芯片变得更通用、更智能。
除了核心软硬件技术开发实力外,市场洞察力和成本控制能力也是AI芯片厂商不可或缺的能力。
目前,这一行业接近Gartner技术曲线泡沫的顶端,未来1到2年将面临市场对产品的检验。只有通过市场检验和筛选的优秀团队才能继续获得产业、政策和资本的支持和青睐。中国的科研机构和企业要努力抓住机遇,争取重塑科技话语权,实现中国半导体产业从追赶到超越。
原文链接:https://zhuanlan.zhihu.com/p/660526117