人工智能大数据,工作效率生产力
Ctrl + D 收藏本站,更多好用AI工具
当前位置:首页 » AI资讯

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速

2024-05-18 107

今天分享的是人工智能ChatGPT深度报告:全面拥抱AI革命,数字中国建设加速》。(报告出品方:西南证券)

精选报告来源:【幻影视界】

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图

从宏观维度认识计算机两大主线——AI与大数据

  • 当前阶段,全球经济正缓慢复苏,但仍然面临劳动力不足、城镇化率增长放缓以及全要素生产率下滑等问题。

  • 面对劳动力不足,城镇化率增长放缓,数据作为新型生产要素,不仅能够直接参与生产,还能够促进其他生产要素的投入并赋能其他要素,产生乘数效应

  • 面对技术进步减缓,全要素生产率下滑,本轮AIGC大模型的突破,是第三次工业革命以来新一轮的通用技术创新,有望解放劳动力,实现对千行百业的赋能。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图1

复盘产业趋势——技术变革(AI)&政策脉络(数字中国)是核心

技术变革引领&政策大力支持是估值拔升的核心原因。计算机是典型的供给决定需求的行业,需求的来源主要是B端与G端的信息化诉求,与IT资源供给的成本、效率、易用性呈正相关。新一轮的技术变革能够催生新的商业模式,拓宽行业边界;而政策的大力支持能够催化技术的成熟,拉动产业需求的加速落地。二者同频共振催动行业景气上行,从而拉动估值提升。

技术变革具备鲜明的时代特征。2008年以来,每个五年计划期间计算机行业都能够孕育一轮指数级别大行情,而每一轮超强行情背后都有具备鲜明时代特征的技术变革做支撑,例如09-10年期间的软硬件普及、13-15年间的移动互联网普及,18-20年间的云计算普及和国产替代,22年底至今的AI大模型突破。

从政策发力方向把握主线脉络。技术变革是厚积薄发的过程,往往需要前期的高额投入和长期积累实践才能形成实质性的突破。由于技术变革的不易感知,紧抓政策的发力方向显得为重要,通常每个五年规划的中后期会有明确投资计划的重磅政策发布,确立相应科技领域的重点投入方向,往往会引领最强的主线行情。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图2

GPT引领AI大模型范式突破

人工智能的发展可分为三个阶段,当前开始向认知智能“破壁”:

计算智能:机器具备记忆能力和计算能力(能存会算)——协助人类完成大量的存储和复杂计算。

感知智能:机器具备视觉、听觉、触觉等感知能力。通常为对声、光、电等物理信号做简单分类,可用函数逼近(能看会认、能听会说)——协助人类完成“看”和“听”的简单工作。

认知智能:机器具备像人类一样的学习和思考能力,涉及常识推理、语义理解、规划决策等,问题 难以定义或用函数逼近(能理解会思考)——部分或全部替代人类做出决策和采取行动。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图3

GPT引领AI大模型范式突破

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图4

本轮AI行情的起点——前沿技术从实验室走向千家万户——正如2013年的移动互联网。

ChatGPT在发布5天后即达到100万用户,发布2个月MAU超过1亿,是历史上用户增长最快的应用程序

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图5

2022.11ChatGPT发布,其多轮对话理解能力、文本生成能力、泛用性较过去的对话机器 人取得明显进步,业界内外开始重新重视起大模型带来的涌现能力。

2023.03GPT4发布,较ChatGPT增加了多模态的图像理解能力,支持更长的上下文理解, 对于复杂任务的处理能力大幅提升,并改善了幻觉和安全等局限性。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图6

图文理解能力提升:通过用法语解决物理问题的案例,可以发现GPT-4在多语言理解、图文理解能力上进一步增强并已融会贯通。

多语言功能强大:根据右下图,GPT-4在小语种能力方面十分出色。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图7

长文本理解能力提升:ChatGPT、GPT-4模型能够分别单次处理3000个单词、25000个单词的文 本量,GPT-4对长文章的阅读、分析、生成能力大幅提高。

复杂问题解决能力提升:GPT-4在不同年龄段、不同类别考试中均名列前茅,平均位列TOP10% 行列。比如,律师职业资格考试排名前10%,生物学奥赛排名前1%等。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图8

创作风格可控:通过系统自定Prompt,让模型可以按照规定风格完成任务回复。

幻觉问题减轻、安全功能完善:GPT-4在各类任务上幻觉问题显著减轻,比最GPT-3.5模型约减轻30%-40%。在安全能力的升级上GPT-4明显超出ChatGPT和GPT3.5。

认知角色:能够为GPT4设定行为角色如律师、医生等,后续将根据设定的角色口吻来作答。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图9

GPT-4 仍存局限,专业能力突破和降本亦是后续投资机会

可信性层面:1)产出结果看似合理但不正确:系统在评判对错上有待改进,可能会生成错误文本;

2)不擅于讨论未来:能够对已发生的事情进行推理,但不易对未来进行假设,与创造性较难兼得;

3)规则化有望加强:模型已具备拒绝不当请求的能力,但有时仍响应不当指令或存在偏差行为。

知识层面:对专业领域问题仍存在一定的理解瓶颈,精准专业能力有所欠缺。

成本层面:1)基础大模型训练资源消耗巨大;2)大模型运行时需要消耗大量服务器资源,需要研究蒸馏压缩、分流等技术处理;3)大模型实现优异性能需要极高的计算成本和工程实现能力。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图10

算力稀缺,兑现度高

算力是AI发展的核心:AI模型向更大参数、更大规模数据集方向发展。自Transformer模型推 出以后,模型的参数以指数级的速度增长,对于算力的需求呈现2个月翻倍的趋势,对应的AI训 练成本也逐年高增。

多模态大模型对于算力的需求更高:多模态大模型需要接受文字、图像、语音等不同类型的数 据处理,涉及到的非结构化数据较多,算法亦更为复杂,在训练和推理阶段相较文本类的LLM ,消耗的算力更多。伴随OpenAI、谷歌、百度等纷纷投入多模态大模型的研发,后续有望持续 带动算力的需求增长。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图11

生成式AI大幅拉动全球AI服务器出货:根据Trendforce,自ChatGPT风靡以来,微软、亚马逊 、谷歌及国内的百度、字节等大厂积极投入,陆续采购高端AI服务器,2023年全球AI服务器出 货量有望接近120万台,同比增长38.4%,而2022年的同比增速仅为8.5%。

国内智能算力规模高速增长:根据IDC及浪潮信息发布的《2022-2023中国人工智能算力发展 评估报告》,以半精度(FP16)运算能力计算,2021年中国智能算力规模达到155EFLOPS, 预计到 2026 年将进入 ZFLOPS(每秒十万亿亿次浮点计算)级别,2021-2026 年智能算力规 模CAGR达52.3%,而同期通用算力规模的CAGR为18.5%。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图12

英伟达业绩与指引超预期,产业趋势得到映证:英伟达FY23Q1收入同比下降13%(优于市场一 致预期 yoy-21.5%),其中数据中心收入同比增长14%;同时,Q2业绩指引不降反增,预计营 收约110亿美元,同比增长约33%(大幅超过市场一致预期71.8 亿美元)

同时,英伟达加大软硬件协同布局,占领AI时代制高点:1)硬件方面:2023年以来,面向日益 庞大的模型参数量及数据吞吐量,英伟达相继发布双GPU产品H100 NVL、采用CPU+GPU架构 的Grace Hopper超级芯片等,结合NVLink Switch打造的超级计算机单台能够提供1EFlops算 力和144TB的共享内存。2)软件方面不断丰富软件栈,与台积电,ASML和Synopsys合作推 出光刻加速库cuLitho,针对量子计算推出Cuda Quantum等。3)算力服务方面:推出 NVIDIA DGX Cloud人工智能云服务,为中小企业提供算力租用服务,起价为36999美元/月

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图13

各省市印发算力建设规划:算力已上升为国家战略资源之一,多地印发算力基础设施建设规划, 提出实现算力调度和交易,构建公共算力平台。

上海:2025年,本市数据中心算力超过18000PFLOPS(FP32),新建数据中心绿色算力占 比超过10%,集聚区新建大型数据中心综合PUE降至1.25以内,绿色低碳等极达到4A级以上。

深圳:建设城市级智能算力平台,整合深圳市算力资源,建设城市级算力统筹调度平台,实现 “算力一网化、统筹一体化、调度一站式”

北京:按照集约高效原则,分别在海淀区、朝阳区建设北京人工智能公共算力中心、北京数字 经济算力中心。在人工智能产业聚集区新建或改建升级一批人工智能商业化算力中心,加强国 产芯片部署应用,推动自主可控软硬件算力生态建设。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图14

关注科技博弈下,国产AI芯片机遇

大模型开启海内外厂商的算力军备竞赛,服务器厂商的AI订单高企,对于毛利率和业绩有 显著拉动作用。但202210月以来,美国BIS升级禁令,使得A100/H100进口受到严重限制。从技术根本上解决芯片的供给问题,或将成为国内AI中长期发展的重中之重。

当前国内海光信息、寒武纪、华为、燧原、壁仞等一二线厂商推出的推理端AI芯片已基本达到 可用状态;训练端芯片虽然较A100性能还有显著差距,但已在国家智算中心得到广泛应用,并 且已与多数互联网大厂展开适配合作,生态成熟度有望进一步追赶。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图15

海内外大模型高速迭代

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图16

国内大模型百家争鸣,通用&垂直两条路径

根据科技部《中国人工智能大模型地图研究报告》,截至2023528日,中国10亿参数规模以上的大模型已发布79个。若算上6月份发布的太极“小可”、恒生电子“LightGPT”等,我国大模型市场已经真正意义进入“百家争鸣”的时代。

从发布大模型的企业类型来看,互联网公司、AI公司以及院校机构是“百模大战”最初的主要参与者,发布的产品以通用大模型为主,定位底层通用平台,以MaaS(模型即服务)形式赋能千行百业;而进入到5月份之后,更多的垂类IT厂商,以及产业界知名学者的初创公司开始发布垂直大模型,其参数更多在十亿级和百亿级,旨在以合适的成本解决垂直领域的实际问题。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图17

MaaS成为新一代底座,有望颠覆云计算商业模式

模型即服务MaaSModelasaService),是既之后IaaSPaaSSaaS之后新一代的云计算服务底座,其以AI大模型为核心,将底层算力、开发框架、向量数据库等工具打包,提供包括模型训练、推理、部署、精调、测评、产品化落地等全方位服务。

MaaS平台的出现,有望颠覆当前“PaaS+SaaS”的开发和交付流程。当前SaaSPaaS在标准化与个性化之间仍然存在难以平衡的问题,而利用云计算厂商提供的大模型商店和相应的平台&工具,下游企业只需要将自身的数据进行训练微调,即可得到适应自身业务的专属大模型,并在此之上按需开发应用功能。整体的开发周期和成本明显下降,产品也将更为精细化、个性化。

后续SaaS有望以MaaS中的微服务形式存在,商业模式或从订阅制变为“按调用次数付费”。同时,“云原生”有望过渡至“AI原生”,各类应用的生产、分发方式将根据大模型进行重构。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图18

模型向多模态发展

多模态大模型能够实现文字、图像、声音、3D物体等异构类型数据的输入输出,具备处理真实 世界的各类信号的能力,通用性较传统意义上的NLP大模型得到大幅拓展,是实现AGI的重要一 步,可应用的场景大幅拓宽。

多模态大模型目前常被用于图文转换(文生图、图片理解)等场景,目前比较成熟的模型有 MidjourneyStableDiffusionDALLE·E 2,国内文心一言、阿里M6、商汤秒画、昆仑万维 天工巧绘等在文生图领域也在不断强化自身能力。

谷歌发布5620亿PaLM-E多模态大模型,不仅能够完成人机对话,图片理解等功能,还能够完 成空间感知、路径规划,在机器人领域具备广阔应用前景。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图19

多模态大模型强化向量数据库需求

多模态大模型的处理过程,是利用Embedding技术将文字、图片、音频映射到高维度空间,即 把图片、声音和文字转化为向量来表示,将这些向量存储起来就构成向量数据库。

向量数据库可以高效的服务于大模型,有效地解决大模型在知识时效性低、输入能力有限、准 确度低等问题,通过将最新资料、专业知识、个人习惯等海量信息向量存储在向量数据库中, 可以极大地拓展大模型的应用边界,让大模型保持信息实时性,并能够动态调整,使大模型拥 “长期记忆”, 在一定程度上解决“AI 幻觉”的问题。

向量数据维度很高,直接进行全量扫描或者基于树结构的索引会导致效率低下或者内存爆炸, 采用近似搜索算法ANNApproximate Nearest Neighbor)来加速向量的检索,可以有效提 升搜索效率。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图20

大模型由云到端协同演进

谷歌于20235月发布PaLM 2大模型,推出四种不同大小的模型,分别为 Gecko(壁虎)、 Otter(水獭)、Bison(野牛)和 Unicorn(独角兽),其中最大的模型Unicorn参数量也比 原来PaLM5400亿参数量小很多,而最小的版本Gecko则可以直接在手机上运行,即使离线 也能在设备上正常工作。谷歌通过提升模型训练数据量和数据集质量、使用计算最优缩放、更新模型架构等方法,使得 PaLM2以更小的参数量,呈现出比原始PaLM更好的性能表现。PaLM2技术报告中提出,数据 集和模型大小应该大约以11的比例,以达到最佳性能。

我们认为,大参数模型受到算力资源有限、高质量数据集有限、部署成本过高等限制,实际应 用中涉及资源如何最优化配置的问题。伴随模型蒸馏等技术方法的成熟,大小模型有望共存, 实现大模型由云到端的协同演进。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图21

大模型赋能自动驾驶

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图22

大模型的野望——具身智能

1950年,图灵在论文《Computing Machinery and Intelligence》便首次提出具身智能的概 念。而受制于AI算法、工程学、物理学等多重限制,具身智能在后续的几十年并未取得明显进 展。传统的工业机器人更多被编程执行重复的系列运动,突出其“机器”属性。

多模态大模型有望赋予机器人更多智能属性,使其像人一样与环境交互感知,实现自主决策、 规划、执行,并在失败中不断学习与进步,是AI的终极形态。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图23

数据要素与信创皆为“数字中国”规划的重要环节

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图24

数据要素、数据要素市场化与经济增长理论关系图

数据要素一方面能够直接参与生产、交换和分配的过程以创造新的需求;另一方面,区别于传统经 济要素,数据要素能够促进其他生产要素的投入并赋能其他要素产生乘数效应

数据要素促进经济增长的前提,需要建立一系列基础设施和政策措施促进数据要素供给方和需求方 开展更多价值创造和交换,实现数据资源向数据资产的转变。

2023年全面拥抱AI革命,GPT引领AI大模型突破,数字中国建设加速插图25

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

本报告共计:101页受篇幅限制,仅列举部分内容。

精选报告来源公众:【幻影视界】

举报/反馈

原文链接:https://baijiahao.baidu.com/s?id=1771363269484544115&wfr=spider&for=pc

相关推荐

阅读榜

hellenandjeckett@outlook.com

加入QQ群:849112589

回顶部