当前位置：首页 » AI资讯

华为云盘古大模型3.0来了！它为何不做中国版ChatGPT？

2024-01-02

477

今年以来，预训练大模型等新兴技术正在掀起新一轮人工智能热潮。百种“模型”并存，百家争鸣，但大模型的真正运用却仍扑朔迷离。

经过半年多的“飓风”，就连曾经爆炸性的ChatGPT流量也不再持续了。当C端的热度逐渐退去时，行业内的喧嚣开始增多：仅靠聊天、画图等功能，大模型能否重构人类社会？人工智能的下一步是什么？

“盘古模型不作诗，只做事”。 7月7日下午，华为常务董事、华为云CEO张平安在2023年华为开发者大会上再次明确了华为在大机型领域的定位，不会做“ChatGPT”产品。他表示，盘古大模型3.0是完全面向行业、根据行业需求而设计的大模型系统。

在华为云看来，人工智能已经成为众多科技公司战略竞争的焦点。与实体经济结合，产业模式发挥重要作用，将带来更大的产业机会。

不要做“ChatGPT”

自2022年12月ChatGPT上线以来，AI大模型加速了新一代人工智能的发展。随着大模型和生成式AI技术的不断突破，不少业内人士开始思考大模型技术在商业运营中的有效性。

在上述开发者大会上，华为认为大机型正在引领新一轮人机革命，为用户带来颠覆性的体验。如果说，在PC时代，“鼠标+图形用户界面”开启了第一次交互革命； “触摸屏+手势”开启了移动互联网时代，“对话+5G”开启了智能互联网时代，以ChatGPT为代表的大型模型技术。

2015年12月，硅谷的创业者启动了OpenAI的引擎，ChatGPT项目也在此时开始酝酿。前一年，谷歌收购了DeepMind，并依靠DeepMind团队开发的AlphaGo在全球掀起了AI风暴。

随后，谷歌在2017年发布了Transformer大模型，成为AI大模型的新分水岭。但令谷歌没想到的是，Transformer 随后成为了 OpenAI 滋养 ChatGPT 的土壤。

OpenAI火爆之后，也激发了科技巨头对大型模型的军备竞赛。今年3月，百度发布文心一言，并开始融入百度所有业务； 4月，阿里发布统一钱文，并于6月将大模型布局拓展至AI音视频赛道。据不完全统计，目前仅国内就发布了80余款大型模型产品，对应不同行业、不同应用场景，“百模型大战”正如火如荼地进行。

不过，进入大尺寸机型领域的时间越长，华为对于大尺寸机型赛道的态度也变得越谨慎。 “在华为看来，面对当前的形势，我们必须保持乐观和冷静。” 华为轮值董事长胡厚昆在6日举行的第六届世界人工智能大会上表示，人工智能发展关键是要脚踏实地，推动人工智能走深走实，真正服务千家万户。的行业。

从华为在大机型领域的布局来看，2020年立项，2021年4月发布“盘古大机型”。在探索过程中，华为逐渐在该领域确立了新的地位。

从7日发布的内容来看，盘古行业模型3.0升级后，盘古将是其“大模型系列”的统称，其中不仅包括语言模型、视觉模型等基础模型，还包括行业专用模型。楷模。金融、制造、药物分子等行业模型以及场景开发类的模型服务。第一财经记者从华为了解到，前期华为云AI在各行业已有1000多个项目，这也为盘古模式在行业的落地铺平了道路。

华为创始人任正非曾指出，未来AI模型将会激增，而不仅仅是微软。人工智能软件平台公司对人类社会的直接贡献可能不到2%，98%是对工业社会和农业社会的推动。

在任正非看来，模型的应用有时比模型本身更有前景。华为将做AI的底层算力平台，但应用平台不是华为的选择。 “2%的平台贡献，我们可以拿一点。” ChatGPT 我们的机会是什么？它将扩大计算和管道流量，使我们的产品有市场需求。”

大型模型如何从概念到实现？

从目前全球市场的竞争格局来看，可用的生成式AI应用已有超过3000个，全球有数千家科技公司参与其中。随着大型机型一路“飓风”，企业需要更加明确应用实施的方向，才能突围这场攻坚战。

张平安表示，“目前大机型的应用大多集中在2C领域，而在行业应用方面，由于行业数据获取困难、技术与行业知识难以结合，行业内大型车型进展缓慢。”

华为选择的突破口一是放大人工智能芯片的算力优势，二是深耕多场景大模型。

华为升腾计算业务总裁张迪轩7月6日接受记者采访时表示，华为已帮助孵化了20多个基础大型模型，例如科大讯飞的星火大型模型。支持”。

2019年8月，华为宣布商用自研AI训练芯片Ascend 910，采用7nm工艺，声称在相同功耗下，其算力是Nvidia V100芯片（上一代Nvidia A100）的两倍。根据华为此前披露的信息，每个集群需要1000台Ascend 910。在受到制裁的情况下，华为目前已将Ascend计算集群的规模从最多4000张卡增加到16000张卡。

这意味着华为成为了英伟达之外的“又一个选择”，为其他行业企业提供大规模算力，并带动自身产品出货量，形成正向景气循环。在盘古大模型3.0官方介绍中，该模型已经可以为客户提供100亿参数、380亿参数、710参数、1000亿参数的系列化基础大模型训练。

另外，张平安在演讲中提到了盘古的“5+N+X”三层架构。

L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型，满足行业场景各种技能的需求。 L1层由N个行业大模型组成。全行业数据训练大模型，包括政务、金融、制造、矿业、天气等大模型。

L2层为客户提供更细致的场景模型，更关注政府热线、网点助理、领先药品筛查、传送带异物检测、台风路径预测等特定行业应用或特定业务场景，为客户提供“出开箱即用”模型服务。

也就是说，华为的大规模模型不仅针对零基础的行业客户，还包括本身使用大规模模型的企业。

张平安表示，盘古大模型已覆盖金融、金融、制造、医药研发、煤矿、铁路等多个行业。 “比如在药物研发领域，研发一种新药平均需要10年时间，耗资10亿美元，盘古药物分子模型帮助西安第一附属医院刘兵教授团队”安交大发现全球40年来首个新靶点、新类别抗生素，将先导药物研发周期缩短至1个月，研发成本降低70%。”

值得注意的是，除了华为云之外，腾讯、阿里、字节、360等科技公司也看到了行业端机会，纷纷瞄准大规模行业模式进行布局。

“对话、写诗、绘画绝不是大模型的全部，我们需要深入思考大模型的应用方向。” 中国工程院院士邬贺铨认为，大模式应该投入到城市发展、金融科技、生物医药、工业制造等领域。、科研等领域也需要专业的企业和组织加速在现实行业的落地，为行业的切身需求带来实质性价值，真正意义上大规模服务社会。

举报/反馈

原文链接：https://baijiahao.baidu.com/s?id=1770786290816210653&wfr=spider&for=pc

人工智能华为张平安盘古盘古团队

声明：本站内容均来自互联网，归原创作者所有，如有侵权必删除。本站文章皆由CC-4.0协议发布，如无来源则为原创，转载请注明出处。
小默AI工具导航网 » 华为云盘古大模型3.0来了！它为何不做中国版ChatGPT？

华为云盘古大模型3.0来了！它为何不做中国版ChatGPT？

相关推荐

评论 ( 0 )

取消回复

AIGC

AI聊天

AI文章工具

实用工具

阅读榜

点击榜

热门标签

华为云盘古大模型3.0来了！它为何不做中国版ChatGPT？

相关推荐

评论 ( 0 )

取消回复

AIGC

AI聊天

AI文章工具

实用工具

阅读榜

点击榜

小默AI工具导航网-1000+AI工具导航