人工智能大数据,工作效率生产力
Ctrl + D 收藏本站,更多好用AI工具
当前位置:首页 » AI资讯

迄今“最强大”、碾压GPT4……谷歌AI大模型问世,马斯克也点赞!股价大涨

2024-05-10 64

当地时间12月6日,美国科技公司谷歌推出了Gemini大模型。与大语言模型ChatGPT不同,Gemini大模型是原生多模态大模型,不仅可以处理文本内容,还可以无缝丝滑地处理代码、音频、图像和视频等多种模态的信息。据介绍,这是谷歌目前规模最大、能力最强的大模型。

Gemini大模型一经推出,便引发了科技圈的“地震”,业内多名人士都对Gemini大模型表达了祝贺与赞美。根据谷歌给出的基准测试结果,Gemini大模型在大部分测试当中都打败了OpenAI的ChatGPT4,显示了先进的性能。

今日美股盘前,谷歌A、谷歌C均大幅上涨,一度涨约4%。开盘后,谷歌股价保持高位,截至发稿,谷歌A涨4.88%,谷歌C涨超5%。

“Gemini 是我们迄今为止最强大、最通用的模型,它在许多领先的基准测试中都展现出了最先进的性能。”在Gemini大模型发布的公开信中,谷歌CEO桑达尔·皮查伊如此说道。谷歌DeepMind的CEO和联合创始人德米斯·哈萨比斯代表团队对Gemini大模型进行了详细介绍。

综合来看,谷歌此次发布的Gemini大模型主要有以下几个亮点:

以上这些亮点中,多模态信息识别、理解与处理能力无疑是谷歌Gemini大模型最令人感到惊艳的一个能力。在一个测评视频中,测评人让Gemini看一系列的影像,并要求Gemini推理所看到的内容。记者看到,当测评人绘制一幅图片的时候,Gemini可以实时描述它所“看”到的画面。更奇妙的是,当测评人展示两张斜坡上的车辆图片,问“从设计上看,哪个车会跑得更快?”时,Gemini会问答:“右边的车更快,它更符合空气动力学。”

Gemini大模型卓越的性能引得科技圈人士纷纷点赞。比如,特斯拉CEO埃隆·马斯克在桑达尔·皮查伊在社交平台X上的发布帖下评论称:“令人印象深刻。”除此以外,马斯克还对谷歌DeepMind的CEO、Gemini团队代表德米斯·哈萨比斯表示了祝贺。

一名人工智能研发人员向记者表示,谷歌Gemini模型的核心优势在于其原生多模态的特性。具体而言,以往的多模态大模型是通过针对不同模态训练单独的组件,然后把这些组件组合起来,模拟多模态功能。虽然在单独和具体的任务上表现良好,但在处理需要更深层次概念理解和复杂推理的任务时,表现往往不尽人意。

“不像OpenAI那样为图像和语音训练独立的DALL-E和Whisper模型,谷歌从一开始就构建了一个多感官模型。”该研发人员表示。

近期,以语音、图片、视频等为主要代表的多模态大模型站上风口。记者梳理发现,多家国内外科技公司密集发布了相关产品。

业内人士普遍认为,多模态是生成式AI下一步的重点方向,百花齐放的应用场景有待继续探索。东方证券研报认为,现阶段大语言模型的竞争已经非常激烈,从技术突破的角度来看,下一阶段的重点攻克方向必然是多模态技术。能够真正处理和应用好多模态AI能力,才能真正打通物理世界和数字世界的障壁,用最基础的感知世界能力直接生成操作,实现与物理世界最自然的交互。

中信证券研报指出,随着谷歌Gemini模型发布,AI进入多模态时代。短期来看,Gemini的发布将进一步激发市场对多模态模型的期待,对产业而言,多模态料将带动算力需求的提升;而在中长期来看,预计多模态模型的升级将丰富相关产品的使用场景,叠加硬件升级、算法优化带来的成本优化,2C产品的进展值得期待。持续看好本轮生成式AI浪潮对科技产业的长周期影响和改变,继续关注算力、算法、数据、应用等环节的领先厂商。

不过,相比于大语言模型,多模态大模型对算力的消耗呈指数级增长趋势。国泰君安研报认为:当前多模态大模型仍在不断迭代,训练阶段的算力将保持增长。根据测算,GPT4对于算力的需求在同等训练时长下相比GPT3增长445倍。训练成本持续高企,算力租赁商业模式具备可行性,短期持续看好算力以及算力租赁赛道。

原文链接:https://baijiahao.baidu.com/s?id=1784635060507960162&wfr=spider&for=pc

相关推荐

阅读榜

hellenandjeckett@outlook.com

加入QQ群:849112589

回顶部