3月16日,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏现场展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
官方表示,文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让百度在中文语言的处理上,能够处于独一无二的位置。作为革新生产力工具,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。
引发搜索引擎革命,百度的“背水一战”
从人工智能风潮发展起来,百度便全身心投入到人工智能业务的发展中来,在百度文心一言发布前夕来看,百度更是将“用科技让复杂的世界简单”作为自己的使命,也确实取得了一系列的成果。
从去年开始,元宇宙、数字人、AIGC等关键词基本可以囊括百度近期所有动作,无论是语言大模型、自动驾驶,还是Web3.0技术产品(百度希壤、百度曦灵数字人平台等),也可以看到,更多的是百度在不断追逐热点,寻找业务增量的过程。
然而,在速途元宇宙研究院看来,“文心一言”对于百度而言,在开拓的同时,让人们看到了更多的“守”的意味。
不得不承认的是,ChatGPT的出现,这种生成式AI大模型,不仅颠覆了人们对于AI语言表达能力的认知,同时也颠覆了人们信息检索的效率。
相比传统的AI聊天工具或AI语音助手,ChatGPT虽然仍存在一些因AI错误理解而导致的瑕疵,不仅拥有远超现阶段语言类AI流畅的表达能力,能够模拟真人来聊天交流,且拥有逻辑清晰的总结能力,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。
从显示信息到直接生成结果,有业内人士评价“ChatGPT 可能是这个时代做出的第一次接近 AGI (Artificial general intelligence,通用人工智能) 的产品。”
而搜索引擎,正是生成式AI首当其冲的对象。目前国内外搜索引擎经过多年发展,虽然技术屡经迭代,不断改进搜索算法如何去更好的排序、更好的给用户展现想要的结果,但表现形式仍然处在传统的链接形式。而ChatGPT的出现,给用户提供了更为“简单粗暴”的搜索结果,从效率的角度出发,用户显然会更容易接受更直接的搜索结果。
掌握了生成式AI的高地,或将完全改变搜索市场的格局。企业对生成式AI的需求不断增长,市场空间进一步抬高,AI市场爆发性的需求增长,将释放出前所未有的、指数级的商业价值。即使是人们曾经认为会“颠覆千行百业”的AI,事实上目前还没有完全地颠覆一些行业,而是将AI技术的基因融入各行各业,重构行业的效率。
面对OpenAI的“鲶鱼效应”,所以在众多想要投身到生成式AI研发的企业中,以搜索引擎为重要流量入口的企业,自然成为最全力投入、也是最迫不及待推出生成式AI模型的企业。
作为OpenAI的投资方,微软直接将GPT的能力整合进了Bing搜索引擎中,近日,微软还宣布将ChatGPT背后的技术整合到其Power Platform平台上,允许用户在几乎不需要编码的情况下,就能开发自己的应用程序。
当前,全球多家大型科技公司,均争相将“生成式人工智能”整合到他们的产品中。
今年2月初,谷歌在演示类ChatGPT的AI聊天机器人产品—— Bard时,错误地把另一个望远镜取得的成就安给了前者,这一错误致使谷歌母公司Alphabet当日股价盘后大跌7.4%,市值蒸发了1056亿美元(折合7172亿元人民币)。
而百度似乎吸取了谷歌的教训,在Demo演示环节,采用了提前录制好的视频,更多注重于能力的演示。不仅如此,百度还在开放方面则采取了内测在先的方式,公布了文心一言的邀请测试方案:3月16日起,首批用户可通过邀请测试码,在文心一言官网体验产品,吸收足够多内测伙伴的反馈,并完善产品之后,再将其推向市场。
文心一言将是百度的重要拐点
回顾百度的发展,1999年,看到中文搜索引擎服务的巨大发展潜力的李彦宏从美国硅谷辞职回国,怀揣着“科技改变人们的生活”的理想在次年创立了百度,帮助中国互联网打造了先进的搜索引擎,也改变了国人查找信息的方式。行业报告显示,2022年上半年,百度仍以75.54%的市场占有率,牢牢坐稳中国搜索引擎的头把交椅。
凭借着优势的市场地位,搜索引擎不仅成为了百度重要的流量入口,也是其互联网业务发展的根基。根据百度近期发布的2022第四季度及全年财报显示,百度移动生态流量强劲,依然是贡献经营利润和现金流的重要来源,第四季度百度移动端搜索查询次数和信息流分发量继续实现同比两位数的增长。
就如同前文所提到,生成式AI的到来,将重塑搜索引擎市场的格局。如果文心一言为百度取得成功,将会进一步提升百度在中国搜索引擎市场的占有率,会给互联网业务带来更多的流量,为移动生态的发展注入更多动能。
同时,作为承载人工智能的重要技术设施,百度智能云的相关业务也将因此受益。基于生成式AI带来的增长,也会引爆服务器算力需求,作为最早在云上布局AI能力厂商之一,也将进一步促进百度智能云的市场份额。
而从企业的属性上,生成式AI的成功开发,将强化百度的“人工智能”属性,并优化百度的收入结构,降低作为传统的互联网企业广告流量为主的营收占比,提高科技相关、尤其是人工智能领域相关的营收占比。
可见,对于站在人工智能“浪潮之巅”的百度而言,文心一言“成则前途无量,败则元气大伤”。甚至在这场为文心一言独立召开的发布会上,李彦宏除了发布重磅产品的自豪之外,语气中还多了几分对于新产品的期待与谨慎,其重要性不言而喻。
中外生成式AI的对抗
就在文心一言发布的前一日(3月15日),OpenAI发布了多模态预训练大模型GPT-4。作为目前生成式AI模型的标杆,抢在文心一言之前发布,行业内纷纷开始讨论“压力是否来到了百度这边”。
在发布会上,李彦宏表示,“文心一言不是中美科技对抗的工具,而是一代代百度技术人员追逐科技改变世界的梦想的产物,是创新驱动发展的最佳证明”。虽然科技巨头之所以能够走在创新的前列,更多是企业在技术理解与演进上的“各显神通”,但在文心一言与GPT-4的产品演示细节来看,我们仍然能够看到两家AI巨头在打造产品的理念上不同。
在新的GPT-4上,产品不仅拥有了更高的回答准确率,同时能够生成歌词、创意文本并实现风格变化,但最大的升级显然是增加了强大的“识图”能力,允许用户指定任何视觉或语言任务,例如分析一张图片的“笑点”与“梗”。
速途元宇宙研究院已经在发布当日收到了“文心一言”的内测资格。在测试的过程中,文心一言能够识别语言的内容,并能够给出具有一定创作力的回答。
即使面对中文语序中出现的倒装,缺乏量词,也拥有一定的识别能力。
速途元宇宙研究院也尝试了李彦宏在现场DEMO中演示的问题,而文心一言的回答与演示的回答并不尽相同,可见文心一言的内容是利用AI大模型真真正正“生成”出来的。
图为发布会演示DEMO
图为速途元宇宙研究院内测截图
在文学创作、商业文案、数理推算、中文理解和多模态生成之外,百度文心一言的优势在于不仅能够生成文字,还融合了百度在AI领域的其他能力,例如文心一格的图片创作能力、以及根据文案自动生成视频的能力,能够生成图文并茂的内容。
图为文心一言截图
图为ChatGPT截图
不过,李彦宏也坦承,文心一言对英文的理解和处理能力现在还没有中文这么好。部分原因是因为在训练数据样本还不够大。
可见,GPT的团队,更像是“从0开始开发AI”,但不可否认的是,从文字、到识图,下一步可能就是视频,团队在不断提高GPT模型的感知维度,而且进步神速。而相比于OpenAI想要做一个真正可以交互的“机器人”,百度则似乎更倾向于将其工具化,通过服务于产业发挥更大的价值。
据了解,现阶段OpenAI的主要收入,仍然多数来自于微软等企业的投资,2019年-2023年,微软先后宣布投资OpenAI累计约130亿美元。据国盛证券报告《ChatGPT需要多少算力》估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。以ChatGPT在1月的独立访客平均数1300万计算,其对应芯片需求为3万多片英伟达A100 GPU,初始投入成本约为8亿美元,每日电费在5万美元左右。与巨大成本成为鲜明对比的是,业内人士估计,OpenAI今年营收仅约为2亿美元。
不可否认的是,对于OpenAI这种几乎没有营收压力的公司来说,自然可以选择更为纯粹的研发路线。然而对于百度而言,不仅要推动人工智能技术的创新的同时,还要兼顾AI技术对于企业带来的“造血能力”,而如何将文心一言的能力实现商业化变现,对于百度而言同样也将是一个重要的挑战。
就目前而言,文心一言仍然是最有可能在国内开展商业落地的模型。
一方面,从技术来看,如今百度是全球为数不多、在这四层进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先业界的自研技术。文心一言基于百度2016年开源出首个国产深度学习框架PaddlePaddle(飞桨),也是国内至今唯一能与国际两大主流框架TensorFlow和PyTorch同水平的深度学习框架,拥有充分的技术自主性。
另一方面,从数据安全角度出发,作为中国企业的百度,在吸引国内企业合作中,也能够避免一些合规性的问题。
从文心一言内测版的体验来看,在语言模型的训练上,虽然在生成的准确性方面,仍然有进步的空间,但在语言表达能力上已经媲美了目前顶尖的生成式AI大模型,也看到了将AI作画与文字相结合的新形态。
在速途元宇宙研究院认为,“文心一言”虽然不是一款全面超越的生成式AI产品,但它在部分能力的表达上,能够看出百度所沉淀的技术能力与创新实力。
就如同发布会上所言,自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。其中,速途网宣布成为百度文心一言(英文名:ERNIE Bot)首批生态合作伙伴。后续,速途网将全面体验并接入文心一言的能力。此举标志着速途网优先获得领先AI技术的加持,也标志着对话式语言模型技术在国内新媒体场景的首次着陆。
未来,速途元宇宙研究院将在第一时间上线文心一言的评测,届时我们将更加详细地剖析国内首个生成式AI的全貌。
原文链接:http://bap-cha.org.cn/bpxz-3435-1.html