今年以来,预训练大模型等新兴技术正在掀起新一轮人工智能热潮。 百种“模型”并存,百家争鸣,但大模型的真正运用却仍扑朔迷离。
经过半年多的“飓风”,就连曾经爆炸性的ChatGPT流量也不再持续了。 当C端的热度逐渐退去时,行业内的喧嚣开始增多:仅靠聊天、画图等功能,大模型能否重构人类社会? 人工智能的下一步是什么?
“盘古模型不作诗,只做事”。 7月7日下午,华为常务董事、华为云CEO张平安在2023年华为开发者大会上再次明确了华为在大机型领域的定位,不会做“ChatGPT”产品。 他表示,盘古大模型3.0是完全面向行业、根据行业需求而设计的大模型系统。
在华为云看来,人工智能已经成为众多科技公司战略竞争的焦点。 与实体经济结合,产业模式发挥重要作用,将带来更大的产业机会。
不要做“ChatGPT”
自2022年12月ChatGPT上线以来,AI大模型加速了新一代人工智能的发展。 随着大模型和生成式AI技术的不断突破,不少业内人士开始思考大模型技术在商业运营中的有效性。
在上述开发者大会上,华为认为大机型正在引领新一轮人机革命,为用户带来颠覆性的体验。 如果说,在PC时代,“鼠标+图形用户界面”开启了第一次交互革命; “触摸屏+手势”开启了移动互联网时代,“对话+5G”开启了智能互联网时代,以ChatGPT为代表的大型模型技术。
2015年12月,硅谷的创业者启动了OpenAI的引擎,ChatGPT项目也在此时开始酝酿。 前一年,谷歌收购了DeepMind,并依靠DeepMind团队开发的AlphaGo在全球掀起了AI风暴。
随后,谷歌在2017年发布了Transformer大模型,成为AI大模型的新分水岭。 但令谷歌没想到的是,Transformer 随后成为了 OpenAI 滋养 ChatGPT 的土壤。
OpenAI火爆之后,也激发了科技巨头对大型模型的军备竞赛。 今年3月,百度发布文心一言,并开始融入百度所有业务; 4月,阿里发布统一钱文,并于6月将大模型布局拓展至AI音视频赛道。 据不完全统计,目前仅国内就发布了80余款大型模型产品,对应不同行业、不同应用场景,“百模型大战”正如火如荼地进行。
不过,进入大尺寸机型领域的时间越长,华为对于大尺寸机型赛道的态度也变得越谨慎。 “在华为看来,面对当前的形势,我们必须保持乐观和冷静。” 华为轮值董事长胡厚昆在6日举行的第六届世界人工智能大会上表示,人工智能发展关键是要脚踏实地,推动人工智能走深走实,真正服务千家万户。的行业。
从华为在大机型领域的布局来看,2020年立项,2021年4月发布“盘古大机型”。在探索过程中,华为逐渐在该领域确立了新的地位。
从7日发布的内容来看,盘古行业模型3.0升级后,盘古将是其“大模型系列”的统称,其中不仅包括语言模型、视觉模型等基础模型,还包括行业专用模型。楷模。 金融、制造、药物分子等行业模型以及场景开发类的模型服务。 第一财经记者从华为了解到,前期华为云AI在各行业已有1000多个项目,这也为盘古模式在行业的落地铺平了道路。
华为创始人任正非曾指出,未来AI模型将会激增,而不仅仅是微软。 人工智能软件平台公司对人类社会的直接贡献可能不到2%,98%是对工业社会和农业社会的推动。
在任正非看来,模型的应用有时比模型本身更有前景。 华为将做AI的底层算力平台,但应用平台不是华为的选择。 “2%的平台贡献,我们可以拿一点。” ChatGPT 我们的机会是什么? 它将扩大计算和管道流量,使我们的产品有市场需求。”
大型模型如何从概念到实现?
从目前全球市场的竞争格局来看,可用的生成式AI应用已有超过3000个,全球有数千家科技公司参与其中。 随着大型机型一路“飓风”,企业需要更加明确应用实施的方向,才能突围这场攻坚战。
张平安表示,“目前大机型的应用大多集中在2C领域,而在行业应用方面,由于行业数据获取困难、技术与行业知识难以结合,行业内大型车型进展缓慢。”
华为选择的突破口一是放大人工智能芯片的算力优势,二是深耕多场景大模型。
华为升腾计算业务总裁张迪轩7月6日接受记者采访时表示,华为已帮助孵化了20多个基础大型模型,例如科大讯飞的星火大型模型。 支持”。
2019年8月,华为宣布商用自研AI训练芯片Ascend 910,采用7nm工艺,声称在相同功耗下,其算力是Nvidia V100芯片(上一代Nvidia A100)的两倍。 根据华为此前披露的信息,每个集群需要1000台Ascend 910。 在受到制裁的情况下,华为目前已将Ascend计算集群的规模从最多4000张卡增加到16000张卡。
这意味着华为成为了英伟达之外的“又一个选择”,为其他行业企业提供大规模算力,并带动自身产品出货量,形成正向景气循环。 在盘古大模型3.0官方介绍中,该模型已经可以为客户提供100亿参数、380亿参数、710参数、1000亿参数的系列化基础大模型训练。
另外,张平安在演讲中提到了盘古的“5+N+X”三层架构。
L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,满足行业场景各种技能的需求。 L1层由N个行业大模型组成。 全行业数据训练大模型,包括政务、金融、制造、矿业、天气等大模型。
L2层为客户提供更细致的场景模型,更关注政府热线、网点助理、领先药品筛查、传送带异物检测、台风路径预测等特定行业应用或特定业务场景,为客户提供“出开箱即用”模型服务。
也就是说,华为的大规模模型不仅针对零基础的行业客户,还包括本身使用大规模模型的企业。
张平安表示,盘古大模型已覆盖金融、金融、制造、医药研发、煤矿、铁路等多个行业。 “比如在药物研发领域,研发一种新药平均需要10年时间,耗资10亿美元,盘古药物分子模型帮助西安第一附属医院刘兵教授团队”安交大发现全球40年来首个新靶点、新类别抗生素,将先导药物研发周期缩短至1个月,研发成本降低70%。”
值得注意的是,除了华为云之外,腾讯、阿里、字节、360等科技公司也看到了行业端机会,纷纷瞄准大规模行业模式进行布局。
“对话、写诗、绘画绝不是大模型的全部,我们需要深入思考大模型的应用方向。” 中国工程院院士邬贺铨认为,大模式应该投入到城市发展、金融科技、生物医药、工业制造等领域。 、科研等领域也需要专业的企业和组织加速在现实行业的落地,为行业的切身需求带来实质性价值,真正意义上大规模服务社会。
举报/反馈
原文链接:https://baijiahao.baidu.com/s?id=1770786290816210653&wfr=spider&for=pc