读创/深圳商报记者 陈姝 文/图
7月7日,在华为开发者大会(以下简称HDC.Cloud)上,华为常务董事、华为云CEO张平安正式发布华为云盘古大模型3.0。
图为华为开发者大会现场
张平安说,AI技术已从多分支发展进入大模型时代,OpenAI发布ChatGPT后,大种大模型层出不究,目前全球已发布数百个大模型,中国发布了超80个,toC类应用百花齐发。他说,很多to C的大模型会写诗作画,华为盘古大模型不会写诗,只会做事。盘古大模型致力于深耕行业,如政务、金融、制造、制药等,为行业带来价值。
张平安在华为开发者大会上
张平安分享了盘古大模型目前在行业应用的一些案例:
如在矿山,他说,中国目前有4400处煤矿,年产45.6亿吨煤,需要280万煤矿工人,数字化智能化程度低。煤矿智能化的目标是建成智能感知、智能决策、自动执行的煤矿智能化体系。盘古让煤矿智能化,让更多工人能在地面和办公室作业。现场展示的视频显示,盘古将一百多路视频集中在一起,能清晰地呈现40多米长的采煤机地下作业的情况以及出现的问题,这让地面工作人员不下井就看得清、看得全和看得准。盘古矿山已在8个矿井复制使用,覆盖上千个煤矿细分场景。
盘古让风云变幻可测。在气象领域,全球每年生成80个台风,登陆我国的大约会有7个。传统预测一个台风的路径,需要3000台服务器,花5小时完成。通过盘古大模型,用1台服务器,10秒就能完成预测。此前,盘古就提前十天预测了“玛娃”台风的路径。
在金融行业,盘古能让每个银行柜员拥有自己的智慧助手。如工行在全国有四万多个网点,20万多个网点员工,工行与华为合作,已开始通过盘古大模型根据客户问题生成操作指引,将以前5次操作缩短为1次,单次办结时间缩短5分钟,而这还是在试点阶段取得的成绩。
在制造行业,盘古已为华为产线制定最优排产计划,将以往“3小时做出1天生产计划”,提升到“1分钟生成3天生产计划”。盘古还能让每个员工都拥有一个“数字人”,通过20秒的历史视频,3分钟就能完成,而这在之前要花上9天,这一功能未来能在客服、直播等领域使用。
张平安正式发布华为云盘古大模型3.0
张平安表示,未来盘古大模型能成为每个行业、企业和个人都有自己的专家助手,让工作更轻松。盘古大模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构:
L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。盘古3.0为客户提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。
L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。
L2层为客户提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。
图为华为开发者大会现场
盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,也可以单独升级能力集。在L0和L1大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。
张平安说,大模型的创新一方面来自自己的创新,另一方面依赖AI各项根技术。华为只能靠自己打造的AI根技术,为盘古提供坚实的AI底座。目前大模型的训练效率领先业界主流GPU的1.1倍。通过昇腾AI云服务,让“一切皆服务,让大模型触手可及”,为开发者带来澎湃、稳定的算力。
华为云2000P Flops单集群的昇腾AI云服务在乌兰察布和贵安同时上线。昇腾AI云服务可以提供更长稳的AI算力服务,千卡训练30天长稳率达到90%,断点恢复时长不超过10分钟。昇腾云服务除了支持华为的AI框架Mindspore外,还支持Pytorch、Tensorflow等主流AI框架,框架中的90%算子,都可以通过华为的迁移工具从GPU平滑迁移到昇腾。
审读:谭录岗
举报/反馈
原文链接:https://baijiahao.baidu.com/s?id=1770746672637486846&wfr=spider&for=pc