人工智能大数据,工作效率生产力
Ctrl + D 收藏本站,更多好用AI工具
当前位置:首页 » 最新消息

6000字详解华为盘古大模型:能否撑起世界AI另一极?

2023-12-08 104

如今,华为在大机型领域秀出了自己的“肌肉”。

7月7日,2023华为开发者大会(HDC 2023)开幕。 在下午两个多小时的主题演讲中,华为云首次详细披露了盘古大模型的进展。 不仅发布了面向行业的盘古大模型3.0,还详细介绍了华为开发大模型的基础技术能力。

盘古大模型3.0包括“5+N+X”三层结构。 三层是指L0层的5个基础大模型、L1层的N个全行业大模型、以及允许用户自主训练更细化场景模型的L2层。 采用完全分层解耦设计,企业用户可以根据自身业务需求选择合适的大规模模型开发、升级或微调,从而适应千行百业不断变化的需求。

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图

华为轮值董事长胡厚昆在近日举行的WAIC大会上表示,华为发展模式的核心是聚焦算力和应用。 一方面是深化算力建设,打造强大算力基础,支撑我国人工智能产业发展。 另一方面,就是将大规模模型结合起来,从通用型大规模模型到全行业大规模研究创新,真正让人工智能服务好千行百业和科学研究。

华为是国内最早部署大规模模型的云服务商之一,早在2021年就发布了盘古大规模模型。在发展大规模模型的道路上,华为打造了AI算力云从底层基于鲲鹏、升腾平台,以及异构计算架构CANN、全场景AI框架MindSpore、AI开发产线ModelArts等技术能力。 。

除了大模型和算力基础之外,会上华为云还重点介绍了盘古大模型与具体行业结合的典型案例。 涉及的行业包括政务、气象、铁路、制造、金融,以及华为的多次升级和重塑。 云软件产品和服务应用案例。

无论是基础技术能力、AI+云产品服务体系,还是具体行业的应用案例,华为云都展现出了高度成熟、系统化的业务能力,着实给业界带来了惊喜。 当大家还在争论谁是中国的OpenAI时,华为云已经为大模型的发展开辟了一条相当成熟的道路。

华为正在用自己的实践证明大规模模型固然重要,但更重要的是用大规模模型解决行业和产品的痛点,做出能让企业和用户付费的产品和服务,真正为千行百业创造价值。

盘古大模型3.0:分层解耦架构

解耦是今天发布的盘古模型3.0的关键词。 这也是这几个月实际调用过大模型的行业客户的共同诉求。

某领先SaaS厂商在发布自己的大规模模型升级应用时表示,“我们不是自己开发大规模模型,而是在不同的业务场景下,哪个大规模模型擅长什么,我们就采取那个模型。” 为了能够在不同的大模型之间切换,“我们自己的产品架构必须是独立于底层大模型的,或者是松散耦合的”。

“盘古大模型的解耦设计是为了行业着想。” 在华为开发者大会上,华为执行董事、华为云CEO张平安给出了盘古大模型的差异化路线。 其核心是解耦盘古模型的各个层和能力,让行业用户根据自己的需求进行开发。

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图1

具体来说,盘古大型模型3.0是面向行业的大型模型系列,包括“5+N+X”三层结构:

“5”代表L0层的五个基础大模型:包括自然语言、视觉、多模态、预测、科学计算大模型,提供多种技能,满足行业场景需求。

盘古3.0为客户提供百亿参数、380亿参数、710亿参数、千亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的多元化需求。 同时,它提供了一组新的能力,包括NLP大模型的知识问答、文案生成和代码生成,以及多模态大模型的图像生成和图像理解。 这些技能可供客户和合作伙伴公司直接使用。 无论大型模型有多大,盘古都提供了一组一致的功能。

“5+N+X”三层结构中的“N”代表L1层的N个行业模型。 提供行业大模型有两种方式:一方面,华为云可以提供利用行业公共数据训练的通用行业大模型,包括政务、金融、制造、矿业、天气等大模型; 另一方面,它可以基于行业客户自己的数据,在Pangea大模型的L0和L1层上,为客户训练自己专有的大模型。

张平安表示:“盘古为服务行业而生,提供多种大规模模型部署、开发、推理形式。它可以像华为的盘古大规模模型一样,生成自己的大规模行业模型,并且只需要输入自己的私密数据即可。” 此外,训练数据也与大模型解耦。

“5+N+X”中的X意味着L2层为客户提供更详细的场景模型,更专注于政府热线、网络助理、领先毒品筛查、传送带异物检测等特定行业。台风路径预测。 为客户提供针对应用或特定业务场景的“开箱即用”的模型服务。

通过“5+N+X”的三层大模型,华为云构建了自己的大模型库。

在昨天的世界人工智能大会上,华为轮值董事长胡厚昆形象地解释道:“对标最基础的层面就是通用大尺度模型,我们称之为基础大尺度模型。我们这个层面的形象叫做读懂读万卷书,就是要做好,学习了大量的基础知识,在这一层还创建了行业模型、场景模型,叫行万里路,读万卷书还有很多挑战需要克服行万里路,关键是华为正在与各行业的合作伙伴一起,将各行业的知识与大模型进行充分的匹配和融合。”

此外,大模型的创新不仅仅是模型本身的创新,还依赖于人工智能各种根技术的创新。 会上,华为诺亚方舟实验室主任姚军介绍了盘古模型的技术基础。

华为底层构建了基于鲲鹏、Ascend的AI算力云平台,以及异构计算架构CANN、全场景AI框架MindSpore、AI开发产线ModelArts等,为大型模型的开发和运行提供分布式解决方案。 并行加速、算子和编译优化、集群级通信优化等关键能力。 基于华为AI根技术,大模型训练性能可调整至业界主流GPU的1.1倍。

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图2

计算能力是训练大型模型的基础。 本次大会上,张平安宣布,单集群2000P Flops算力的升腾AI云服务将在华为云乌兰察布、贵安AI算力中心同步上线。 升腾AI云服务除了支持华为全场景AI框架升思MindSpore外,还支持Pytorch、Tensorflow等主流AI框架。

同时,这些框架中90%的运营商都可以通过华为的端到端迁移工具平滑迁移到Ascend平台。 例如,美图秀秀在短短30天内将70个模型迁移到Ascend。 同时,华为云与美图团队联合优化了30多个算子,并行加速了进程。 与原方案相比,AI性能提升了30%。

另外,大型模型训练时经常会遇到GPU故障,开发者不得不频繁重启训练,耗时较长,成本较高。 升腾AI云服务可以提供更稳定的AI计算服务。 30天大卡训练长期稳定率达到90%,断点恢复时间不超过10分钟。

赋能千行百业

任正非此前表示,“人工智能软件平台公司对人类社会的直接贡献可能不到2%,98%是对工业社会和农业社会的推动。但应用平台不是我们的选择,我们会AI算力平台底层。”

让大机型走进千行百业,成为华为大机型发展的重点。 会上,华为云介绍了盘古大模型在政务、铁路、气象、金融等七大领域的应用案例。

政务

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图3

政务领域,华为云联合深圳市福田区政务数据管理局基于盘古政务模式推出福田政务智能助手小福,可精准了解民众咨询意图,改变传统一站式服务模型。 通过微调12345热线、政策文件、政务百科等超过20万条政务数据,政务助理掌握了法律法规、办理流程等丰富的行业知识。

华为云表示,盘古政务大模型的核心是认知能力。 让城市公共系统被看见、被理解,完成从感知到认知、处置的闭环。 并根据不同场景,提供问答、文案生成、视频感知、多模态理解等不同能力。

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图4

华为云介绍了两个典型场景:一是咨询场景,企业用户向政务助理咨询相关投资支持政策,政务助理可以介绍相关法规政策,并向顾问提供合适的建议; 第二个场景,如上图所示,是基于对话、多模态能力的政务处理场景。 工作人员可以根据摄像头拍摄的图片,智能分析图片中的违规行为。

铁路

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图5

在铁路领域,华为展示了货车巡检助手的应用案例。

传统的列车检查员每天必须检查数百万张列车图片,以检测铁路网络上运行的货车是否存在故障。 盘古大模型引入后,可准确识别现网运行的67种卡车、430余种故障,无故障图片筛选率高达95%。 也就是说,列车巡检员只需检测以往1/20的列车图片,相当于工作效率提高了20倍。

煤矿

在煤矿领域,盘古矿大型模型已在全国8个矿井使用。 一个大模型可以覆盖煤矿开采、挖掘、机械、运输、运输、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人可以在地面工作,这不仅让工作环境变得更加美好。煤矿工人更加舒适,也大大减少了安全事故。

气象

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图6

气象领域是华为云发布会的焦点。 就在日前,盘古气象大模型的研究成果发表在国外顶级期刊《自然》上,审稿人评论道:让我们重新审视天气预报的未来。

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图7

原本,为了预测台风未来10天的路径,需要在3000台服务器的高性能计算机集群上模拟5个小时。 现在基于预训练的盘古大陆气象大模型,通过AI推理,研究人员只需在单台服务器上配置单卡,就可以在10秒内获得更准确的预测结果。

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图8

目前,盘古大陆气象大模型可用于预报海浪、高温、台风、寒潮等天气。 与传统天气预报相比,它更快、更准确。 此前,盘古与气象局合作,提前10天预测了“玛娃”的路径。 此外,盘古还提前两天预测芬兰将迎来寒潮。 与欧洲气象局的预测相比,盘古的预测也更接近真实气温。

金融

在金融领域,盘古大模型与工商银行合作打造了一系列探索性应用。

典型场景之一就是提高银行柜员的工作效率。 工商银行在全国拥有数万家网点,20万名网点柜员。 他们需要在各种服务之间切换,这会浪费大量时间。

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图9

盘古金融大模型对银行各类操作、政策、案例文件进行预训练,并能根据客户问题自动生成柜面工作人员的流程和操作指导,将原本需要5次操作的平均操作次数减少到1个结,时间缩短了超过5分钟。

而这还只是最基本的应用。 华为正在与金融行业共同探索,未来将大模型应用于信用分析等更多金融场景。

制造业

华为本身也是一家制造企业。 其制造的硬件产品涉及通信基站、手机、汽车、芯片等领域。 基于过去积累的经验,华为将盘古大模型引入生产制造领域。

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图10

过去,单条生产线一日生产计划制定设备配置计划往往需要3个多小时。 在学习了华为生产线的各种设备数据、业务流程和规则后,盘古制造大模型可以准确理解业务需求,并调用天仇AI求解器插件,一分钟搞定未来3天。 生产计划。

药物发现

在药物研发领域,一款新药的原创研发平均需要10年时间,耗资10亿美元。 盘古药物大分子模型帮助西安交通大学第一附属医院刘兵教授团队40年来发现全球首个新靶点、新类别抗生素,并将先导药物研发周期缩短至一个月并降低70%的开发成本。

大模型融入华为云产品体系

除了在千行业的实践,华为云盘古模式也深度融入到华为云的产品服务中,重构产品创新。

盘古大模型+华为云服务

在盘古模式的加持下,华为云一系列B端产品和服务得到了升级重构。 会上,华为云介绍了数据服务、云客服、BI、云搜索四大服务升级细节。

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图11

盘古大模型+CodeArts代码工具

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图12

华为云将CodeArts研发工具与盘古大模型相结合,正式发布了开发者智能编程助手CodeArts Snap。

该工具已训练了 760 亿行选定代码和 1300 万份技术文档。 具有智能生成、智能问答、智能协作三大核心功能。 可以实现对话一句生成代码,一键自动标注和生成测试用例。 一条命令智能部署,让每一位软件开发者拥有自己的编程助手。

盘古大模型+数字人

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图13

华为云通过盘古基础大模型赋能MetaStudio数字内容生产线,打造盘古数字人大模型,提供模型生成和模型驱动两大服务,并使用20万小时音视频数据进行预训练。

基于这两大服务,开发者可以快速生成并驱动数字人模型,赋能在线教育、娱乐直播、企业会议等行业应用,让每一位企业员工实现“数字人自由”。 例如,用户只需在华为云MetaStudio服务页面上传一段20秒的个人视频,即可快速生成个性化的数字真人解说视频。 过去需要三名研发人员三天完成的工作,现在只需三分钟即可完成。

盘古大模型+实体智能

会上,华为云还提到了盘古模型在机器人领域的应用,并演示了一段视频。

6000字详解华为盘古大模型:能否撑起世界AI另一极?插图14

过去,向机器人下达命令需要开发人员进行编程,但基于盘古模型的自然语言理解能力,机器人可以识别自然语言、执行命令,并具有全局感知引导的自主智能。 会上,华为演示了一段视频,用户无需输入程序指令,只需要用自然语言向机器人下达指令,机器人即可完成拾取物品等指令,并会根据情况进行自主判断。对过程中的环境(如移动过程中打开遮挡目标物体的杂物)来完成任务。

据华为介绍,上述演示并非概念视频,而是真实产品,在HDC大会期间在会场展出。

总结与思考:华为能否成为AI的另一极?

张平安表示,“为了帮助全球客户、合作伙伴、开发者训练和使用大型模型,我们致力于为全球客户打造世界人工智能的另一极,为所有人工智能开发者提供新的选择。”

甚至更早的时候,早在今年3月份,任正非就曾在公司内部表达过类似的意思。 他表示,人工智能模型将会激增,而不仅仅是微软。 任正非的理由其实就是华为云今天努力的方向,即人工智能软件平台公司对人类社会的直接贡献可能不到2%,98%是对工业社会和农业社会的推动。

例如,中国和德国的工厂正在推动人工智能向行业的推广,从而实现无人化生产; 例如,天津港码头也尝试了货物无人装卸。 输入代码后,集装箱将自动从船上移走。 拎过去然后用车运走; 例如,在山西煤矿,井下使用5G+人工智能后,人员数量减少了60-70%,大多数人穿着西装在地面控制室工作。

这些都是过去几年人工智能大规模应用于工业端的例子。 这些行业的共同点是规模和产值巨大,效率的一点提升就能带来巨大的效益。

大模型的出现本质上提供了更高效的生产力工具。 一方面,对于这些已经拥抱人工智能的行业来说,意味着更高的效率和更快的转型过程; 而更高的效率意味着更容易算出更多行业的“经济账”,AI有潜力从改造所谓的主要行业来改造数千个行业。

这就是华为毅然进入这个行业的原因。 事实上,阿里云、腾讯云、火山云、百度云等国内主要云服务公司也有类似的想法。 在方向一致、起点相近的情况下,谁能在这场比赛中跑得最快,关键在于从算力、大模型库、平台、产品到具体解决方案的全链条能力。

由于众所周知的原因,华为无法获得目前公认的全球最先进的计算芯片,在这场竞争中似乎先天不足。 但从今天的发布会来看,华为并不能看出自己因为上游的制约而落后。 在大模型的钥匙链上,已经拿出了成熟的产品和案例,而解耦的盘古大模型架构更是让人眼前一亮。 事实上,考虑到如今本土化的需求,在算力方面并不落后的华为很可能成为自主可控的优势。

大机型成为华为的新机遇,而且看起来正在成为现实。

举报/反馈

原文链接:https://baijiahao.baidu.com/s?id=1770777743847239781&wfr=spider&for=pc

相关推荐

阅读榜

点击榜

hellenandjeckett@outlook.com

加入QQ群:849112589

回顶部