“大模型带来的智能涌现,是我们开发AI原生应用的基础。”10月17日,李彦宏在“百度世界2023”大会上表示。当天,李彦宏在主题演讲环节发布了文心大模型4.0版本,并带来新搜索、新地图等十余款AI原生应用。
李彦宏表示,这是迄今为止最强大的文心大模型,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着显著提升,综合能力与GPT-4相比毫不逊色。
四大能力显著提升
据了解,本次发布的文心大模型4.0,相比今年5月的3.5版本,理解、生成、逻辑、记忆四大能力都有显著提升。其中,逻辑和记忆能力的提升更大,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。百度CTO王海峰表示,百度基于文心大模型研制了智能代码助手Comate,从内部应用效果来看,整体的代码采纳率达到40%,高频用户的代码采纳率达到60%。
据悉,文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了近30%。训练算法效率自3月以来已累计提升3.6倍,周均的训练有效率超过98%。文心大模型4.0基本技术架构与3.0和3.5版本一脉相承,并在多个关键技术方向上进一步创新突破。
基于文心大模型4.0,李彦宏依次演示了四大能力的特点与应用场景。在理解能力上,他通过询问公积金异地贷款政策的案例,展示了文心一言对前后乱序、模糊意图、潜台词等复杂提示词的理解力,例如“在北京工作”等同于“在北京缴纳公积金”等等,“今天,你说的每一句话,它大概率都能听懂。”李彦宏表示。
在生成能力上,李彦宏展示了文心一言如何在短短几分钟内,根据一张素材图片,迅速生成了一组广告海报、五条广告文案以及一条营销视频。据介绍,基于这一系列能力,百度已经推出了AIGC营销创意平台擎舵,让“一个人就成为一支AI营销队伍”。
同时,他还通过解数学题、总结知识点等场景,展示了大模型的逻辑能力;通过数千字的小说撰写和角色、情节设置,体现了大模型的记忆能力;以及数字人医生帮助患者解读药品说明书,来展现四大能力的综合应用。
王海峰介绍,在基础大模型的基础上,百度进一步研制了智能体机制,包括理解、规划、反思和进化,能够做到可靠执行、自我进化,并一定程度上将思考过程白盒化,让机器像人一样思考和行动,自主完成复杂任务,在环境中持续学习实现自主进化。
百度“全家桶”焕新
丰富的AI原生应用才是大模型的价值所在。李彦宏宣布:“我们的搜索、如流、地图、网盘、文库等,都将以一个全新的面目与大家见面。”
“所谓AI原生应用,我的理解,就是基于大模型的理解、生成、逻辑和记忆能力开发出来的应用。这些能力是过去的时代所不具备的,因而才能打开无限的创新空间。”李彦宏表示。
李彦宏介绍,百度新搜索具有极致满足、推荐激发和多轮交互三个特点,当用户搜索问题时,新搜索将“不再是给你一堆链接”,而是通过对内容的理解,生成文字、图片、动态图表的多模态答案,让用户一步获取答案。在针对复杂需求时,“多轮交互”特点也可以通过提示、调整等方式,满足用户更个性化的搜索需求。
百度网盘是百度旗下最重要的产品之一。百度网盘在AI重构的方向上,重点是做好个人文件的智能服务。“重构后的网盘,不但实现了从图形界面交互到自然语言交互的转变,还增强了多模态信息理解。现在,只需要一句话,就能对自己网盘内的文件、图片、视频等进行操作。”李彦宏表示。
百度文库也迎来“焕新”。据悉,百度文库基于10亿优质资料,能实现写稿和做PPT等工作,完成了从“内容工具”向“生产力工具”的进化。据介绍,百度文库新版本开放首日,AI新功能就迎来超过200万人次体验。
百度地图和智能办公平台如流,也通过理解、记忆等能力,升级为出行向导和超级助理:在地图上,用户只需说出需求,地图就能调动几千个服务接口,帮助用户推荐餐厅、对比多地点信息、给出出行建议;如流则可以针对群聊信息多的办公痛点,能够“一秒划重点”。
原文链接:https://www.cet.com.cn/itpd/itxw/3461453.shtml