4月7日,阿里云官方宣布,上线自研大模型聊天AI“通义千问”,并定向邀请企业用户进行测试。
昨天(4月10日)下午,商汤科技董事长兼首席执行官徐立,在商汤技术交流日活动上,宣布推出大模型体系“商汤日日新大模型”,聚焦自然语言生成、文生图、感知模型标注、以及模型研发功能。
同样是昨天下午,离开搜狗已经500多天的王小川低调亮相,召开了新公司“百川智能”的媒体沟通会,正式对外宣布投身AI大模型竞赛。全新的身份,全新的姿态,至此,又一位商业大咖加入了大模型浪潮。
大佬们纷纷涉足新领域,让本就火热的AI市场再次热闹起来。而在这一众焦点中,华为推出的大模型似乎多了些不同。
事实上,大模型的应用场景非常广。如果说之前ChatGPT、谷歌搜索和百度“文心一言”,激起了人们对于未来大模型在C端应用的无限想象。那么,华为的盘古大模型,则给了各行各业的数智化转型带来更多信心,虽然这件事做起来并非易事。
大模型:开启B端应用新想象
在上周六(4月8日,杭州)中国人工智能学会主办的人工智能大模型技术高峰论坛上,华为云AI领域首席科学家、国际欧亚科学院院士田奇,分享了关于华为盘古系列大模型的研发与应用落地情况。
盘古大模型包括NLP(自然语言处理)大模型、CV(机器视觉)大模型、科学计算大模型、多模态大模型、语音大模型等多个模型。但在整个叙述中,华为方面对NLP语言大模型的着墨并不很多,而是更加聚焦于工业端方方面面的应用。
从华为方面的叙述中,也能看出来这次大模型跟同业有不少差别,华为跟以往一样更多看重AI for Industry(AI赋能产业),希望为煤矿、水泥、电力、金融、农业等行业创造更多产业价值。
根据介绍,几大模型已经陆续投入应用。其中,盘古CV大模型覆盖了工业质检、物流仓库监控、时尚辅助设计等行业;盘古NLP大模型覆盖了智能文档检索、智能ERP、小语种大模型等领域,比如去年交付了一个阿拉伯语的千亿参数大模型;盘古科学计算大模型也用在了气象预报、海浪预测等方向。
大会结束后,外界就华为这一大模型进行了诸多解读,也有人认为这次华为的大模型,纸面概念居多,落到实际应用还需要更久的时间。
不过,笔者以为,工业应用相较于消费应用,需要海量数据和应用场景的全面适配,往往需要更大的算力、更大的模型来进行支撑,并非朝夕可至,需要更多的时间也很正常。
不仅如此,针对大模型在B端的全面应用覆盖,目前市场上也就华为提出了相关概念。用户需要基于ChatGPT语言模型的消费端应用,B端工业场景的应用同样不可或缺,某种程度上来看甚至更重要,且并非易事。
下一个风口的想象已然开启
虽然今年以来基于自然语言处理( Natural Language Processing, NLP)的语言大模型,一直是市场关注的热点,更有ChatGPT、文心一言、通义千问等受到关注的产品落地。
但显然,华为对自己的定位坚定且明确——用好过往在工业场景的沉淀和积累,赋能行业发展。这一理念在华为消费端以外的业务中处处可见踪影,包括新能源车项目。
据了解,关于盘古大模型这一项目,华为云从2020年9月开始推动立项,2个月后内部立项成功,之后一直处于紧锣密鼓的开发测试阶段。
根据田奇分享,2021年9月,华为云发布了盘古药物分析大模型;2022年6月,华为云发布了盘古矿山大模型;2022年11月,盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型同期亮相。
三年对于大模型这类AI项目来说,也许算不上是长周期,却让市场对于华为B端业务的有了更多想象。
在大会上,田奇强调,随着人工智能走进企业核心生产系统,将会创造出更大价值,预计2026年人工智能行业渗透率将达到20%。
基于从小模型到大模型,过去10年内AI算法的算力需求提升了40万倍,未来大模型发展资金需求将会更高,技术门槛也会更高,市场可能向大公司集中,毕竟大模型开发和训练一次1200万美元,资本门槛变高。
另外,人工智能与科学计算的交汇,工业、气象、能源、生物医学等众多领域都受到人工智能的深刻影响,华为大模型会重点做好行业应用。
从以上种种信息的披露来看,华为认为B端的大模型应用,将会集中在头部公司,而华为显然就是那个头部公司。大模型需要海量数据,过往在工业场景中积累的海量数据就是华为的底气。
目前大模型在工业端的应用处于起步阶段,华为开了个好头,接下来可能还会有更多B端头部企业躬身入局。
【免责声明】文章内容仅供研究和学习使用,不构成任何投资建议。
原文链接:https://m.163.com/dy/article/I2194JOI05199O55.html