【核心观点】
基于昇腾AI平台,打造中国智算网络。国内多地人工智能计算中心已上线运营,均基于昇腾AI基础软硬件平台。我们预计,中国算力网为未来有望成为全国大型算力底座,支撑国家“数字经济”和“东数西算”重大战略。最接近人类中文理解能力的AI大模型。盘古NLP大模型是业界首个千亿参数中文语言预训练模型,在预训练阶段学习了40TB中文文本数据,是最接近人类中文理解能力的AI大模型,下游应用仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。盘古CV大模型首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求。目前盘古CV大模型在ImageNet10%数据集上的小样本分类精度上达到目前业界最高水平。可实现一个模型在众多场景规模化复制,多行业受益。盘古NLP大模型可以实现一个AI大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,让AI开发由作坊式转变为工业化开发的新模式。我们认为,未来随着盘古系列AI大模型的上线,将持续赋能金融、电力、交通、气象、物流等行业,华为产业链及下游应用相关公司有望持续受益。
【正文】
1. 中国算力网——智算网络
国内AI、算力发展面临卡脖子等难题。去年8月份,英伟达收到美国政府通知,限制公司未来向中国和俄罗斯出口A100、H100,且限制还包括NVIDIA未来任何峰值性能和芯片对芯片的I/O性能均等于或大于A100的阈值的产品。同年10月,美国商务部(BIS)公布了对于中国出口管制新规声明,主要针对先进芯片及芯片制造设备,其中包括应用于AI、超算等HPC领域的CPU、GPU、AI加速器等高算力芯片或含有此类芯片的计算机商品,同时对已被列入实体名单的28家中国实体进一步加强出口管制,包括多家中国CPU、GPU芯片设计公司及AI算法公司。
“中国算力网”是鹏城实验室在国家有关部委指导下推进的算力网络计划。该计划提出了“像建设电网一样建设国家算力网,像运营互联网一样运营算力网,让用户像用电一样使用算力服务”的发展愿景。
基于国产昇腾AI平台,助力人工智能普惠化。多地人工智能计算中心已经上线运营,包括深圳、武汉、成都、西安、中原、南京、杭州等城市,均基于昇腾AI基础软硬件平台建设,让城市AI算力成为新的公共资源,智能化变得更加普及。未来,各地人工智能计算中心将会相互联接,形成智算网络,这已是大势所趋。
我们预计,中国算力网为未来有望成为全国大型算力底座,为各地的人工智能计算中心、超级计算中心和“东数西算”枢纽节点等提供协同调度和高效计算服务,支撑国家“数字经济”和“东数西算”重大战略。
2. 华为盘古大模型——开启工业化AI开发新模式
盘古大模型是由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题。
2.1. 盘古NLP大模型参数达2000亿,小样本学习超越GPT系
盘古NLP大模型是业界首个千亿参数中文语言预训练模型,预训练阶段学习了40TB中文文本数据,是最接近人类中文理解能力的AI大模型。
首次使用Encoder-Decoder架构:
兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配;2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。
应用场景:
智能舆情:利用文档信息抽取、情感分类、文档自动摘要等关键技术,在金融、电商、政务领域实现精准舆情分析、企业运营软件分析。
智能营销:利用文本匹配,问答和对话系统、意图识别等关键技术,取代目前逐渐上升的人力成本和低成功率的智能客服与营销系统。
2.2. 盘古CV大模型:30亿参数,10亿级图像,业界最大预训练CV模型
首次实现模型按需抽取的业界最大CV大模型,首次实现兼顾判别与生成能力:
基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一。
业界最大预训练CV模型:30亿参数,10亿级图像
判别与生成联合预训练:底层/高层视觉预训练任务通用
100+场景验证:研发成本降低90%
小样本学习性能领先:ImageNet10%标签分类精度业界第一
应用场景:
智能巡检:进行无人机智能巡检,并解决巡检系统中数据标注工作量大和缺陷种类繁多问题。数据筛选效率提升30倍、筛选质量提升5倍,模型的精度比普通模型提升18%。
智慧物流:1个模型覆盖9种物流场景,监测收货、入库、在库和出库全流程。
2.3. 盘古气象大模型:速度较传统数值方法提升1000倍
气象预报精度首次超过传统数值方法,速度提升1000倍:
借助创新的3DEST网络结构以及分层时间聚合算法,盘古气象大模型在气象预报的关键要素(例如,重力势、湿度、风速、温度等)和常用时间范围上(从一个小时到一周)精度均超过当前最先进的预报方法,同时速度相比传统方法提升1000倍以上。
同时,盘古气象大模型支持广泛的下游预报方案,如在台风路径预测任务上,相比传统数值气象预报方法,盘古气象大模型可以降低20%以上的位置误差。
2.4. 已在电力、金融等多个行业应用
国家电网:
无人机电力巡检:基于盘古CV大模型的智能缺陷识别,视觉预训练大模型助力下游缺陷识别,进一步提升巡检效果,缺陷样本标注代价减少 85%;平均精度提升 18%。
浦发银行:
浦慧云仓:盘古CV大模型1个模型覆盖9种物流场景,监测收货、入库、在库和出库全流程。9种场景差异较大,大模型具备较强泛化能力。异常样本种类多、数量少,大模型可利用小样本数据取得高精准度结果。利用大模型的时空对齐能力,综合多摄像头数据,解决局部遮挡等问题,准确估计物体轨迹。
广发证券:
企业财务智能预警:2019年有496家企业被监管处罚、问询或被ST处理,利用盘古大模型预测出其中439家,覆盖率近90%,其中被监管处罚企业111家,盘古大模型全部命中,无一家遗漏。
3. 建议关注
盘古 NLP 大模型可以实现一个 AI 大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,让 AI 开发由作坊式转变为工业化开发的新模式。我们认为,未来随着盘古系列AI大模型的上线,将持续赋能金融、电力、交通、气象、物流等行业,华为产业链及下游应用相关公司有望持续受益。建议关注:
底座硬件:拓维信息、四川长虹、神州数码、常山北明
底座软件:麒麟信安、中国软件
2B应用:
金融:长亮科技、中科软
电网:智洋创新、东方电子
其他:中科创达(与电子组联合覆盖)、赛意信息、东方国信
2C应用:金山办公、同花顺、科大讯飞、万兴科技、光云科技、当虹科技、视源股份(与电子组联合覆盖)s
4. 风险提示
1)AI应用落地不及预期:若AI相关应用的落地不及预期,相关公司或将受到影响;
2)技术发展不及预期:目前AI技术发展迅速,相关模型短时间内多次迭代,如相关技术发展速度无法匹配AI发展,相关公司或将受到影响;
3)国内大模型进展不及预期:GPT系受到国内外广泛关注,国内加速国产大模型研发,若后续研发进展及应用不及预期,相关公司或将受到影响。
本文源自:券商研报精选
作者:天风研究
举报/反馈
原文链接:https://baijiahao.baidu.com/s?id=1761571685822125196&wfr=spider&for=pc