人工智能大数据,工作效率生产力
Ctrl + D 收藏本站,更多好用AI工具
当前位置:首页 » 最新消息

Manus:中国AI创新力,开启通用智能体的新时代

2025-03-10 2

更多精彩内容可点击华彬智融知识数据库」免费解锁🔓~

2025年3月6日,中国科技领域迎来里程碑式突破——由Monica.im团队研发的全球首款通用AI智能体产品“Manus”正式上线。

这款被业界誉为“聪明实习生”的AI助手,凭借其自主执行复杂任务的能力,一夜之间引爆全球科技圈,推动A股AI相关板块大涨,软件ETF单日涨幅超3%。

Manus的诞生不仅刷新了AI技术应用的高度,更标志着中国团队在智能体(Agent)领域实现了对国际巨头的超越。

Manus:中国AI创新力,开启通用智能体的新时代插图

官网直达:Manus

官方介绍视频:https://files.manuscdn.com/assets/video/Manus-Chinese-2k-compressed-v2.mp4

一、核心功能:从规划到执行的完全自主化

Manus的颠覆性在于其真正实现了“端到端”的任务处理能力。与传统AI工具仅提供建议或简单执行不同,Manus能独立完成全流程:

  • 复杂场景落地:自主筛选简历并生成人才评估报告、为购房者分析房源优劣势、完成多维度股票投资分析等。

  • 持续学习进化:通过记忆用户偏好优化服务,如在旅行规划中逐步掌握用户对酒店档次、餐饮口味等个性化需求。

  • 跨平台协作:突破设备限制,可在虚拟环境中调用各类工具,执行质量在权威GAIA基准测试中创下新纪录。

二、技术突破:多重代理架构引领行业革新

为实现真正的自主智能,Manus采用三大技术创新:

  1. Multiple Agent系统

    三大模块基于独立模型协同工作,模仿人类“思考-行动-检查”的完整流程。

    1. 规划代理(拆解任务逻辑)

    2. 执行代理(调用工具实施)

    3. 验证代理(结果质量审查)

  2. 多重签名验证体系:通过多模型交叉验证决策可靠性,避免单模型偏见风险。

  3. 开源承诺:计划2025年内开源核心推理框架,降低开发者接入门槛。

类别

详情

核心技术

多重签名系统与 Multiple Agent 架构:采用 “多重签名系统” 与 “Multiple Agent” 架构,由多个独立模型协同驱动,可在虚拟环境调用各类工具。此架构赋予 Manus 强大的任务处理及工具调用能力,能灵活编写代码、智能浏览网页、操作各类应用。

自主学习与记忆技术:拥有记忆功能,基于历史数据和经验优化任务执行策略。可理解复杂指令,在任务执行中不断学习,提升自身性能与处理问题的能力。任务分解与规划技术:能将复杂任务拆解为待办事项列表,逐一匹配并执行,如同人类有条理地处理任务。

自然语言处理技术:可理解用户以自然语言描述的需求,并快速响应执行,实现高效人机协作。

优势

自主执行能力强:可在云端独立完成任务,无需过多人工干预,直接交付完整成果。用户可随时关闭电脑,Manus 在后台异步工作,完成任务后通知用户。

应用场景广泛:涵盖研究、生活、数据分析、教育、生产力工具和创意娱乐等 6 大类别、51 个具体用例。如简历筛选,自动解压文件、浏览简历、记录重要信息、给出排名建议并生成 Excel 表格;房产筛选,分解任务、创办待办清单、阅读文章、计算预算、筛选房源、整合信息撰写报告;还有股票分析、旅行规划、教学辅助、销售数据分析等场景。

性能卓越:在 GAIA 基准测试的所有三个难度级别上均取得优异成绩,性能超越 OpenAI 的同层次大模型。

高效人机协作:开创人机协作新范式,用户用自然语言描述需求,Manus 快速理解执行,执行中还能接收新指示。

三、团队基因:90后创始人的破局之路

背后的灵魂人物肖弘(1992年生)展现了中国新生代创业者的特质:

  • 技术积累:华中科大软件工程专业背景,2015年创立夜莺科技,推出服务超200万企业的SaaS工具。

  • 产品嗅觉:2022年转型AI赛道,海外产品Monica已获千万用户,实现盈利闭环。

  • 资本助力:获真格基金、腾讯等顶尖机构投资,为Manus的研发提供充足弹药。

四、市场冲击波:重构AI产业格局

Manus的横空出世引发连锁反应:

  • 投资热潮:AI算力、数据标注等上游企业股价普涨,行业融资活跃度提升35%。

  • 竞品压力:OpenAI等巨头紧急调整路线图,原定2026年发布的Agent产品提前至2025Q4。

  • 生态机遇:开放API后,已有200+企业接入测试,覆盖金融、招聘、咨询等行业。

五、争议与挑战

在赞誉声中,Manus也面临质疑:

  • 安全隐患:完全自主的决策是否需设置伦理审查机制?

  • 能力边界:展示案例集中于结构化任务,对开放式创新类需求(如文学创作)尚未验证。

  • 命名混淆:需注意与荷兰Manus公司的动捕手套区隔,避免品牌认知混淆。

六、AI Agent 对比

Manus 对比 Coze

在核心技术、任务执行能力、应用场景、性能表现等方面

对比维度
Manus

Coze

核心技术

采用 “多重签名系统” 与 “Multiple Agent” 架构,多个独立模型协同驱动,在虚拟环境调用工具;具备自主学习与记忆技术、强大的任务分解规划及自然语言处理技术,可理解复杂指令、从任务中学习优化

基于深度学习,涵盖语音识别、自然语言处理、图像识别等技术,能理解语音指令、进行智能对话、识别图像等

任务执行能力

能独立思考、规划并执行复杂任务,直接交付完整成果,在云端自动运行,可异步处理文件,完全在独立虚拟机运行,执行质量高,可跨更多领域

主要用于开发各种 AI 功能,用户通过创建和部署 bot,选择模型、输入 prompt 实现功能,多代理模式能调动多个 bot 协同工作,但任务执行侧重基于用户设定的规则和指令,自主执行复杂任务能力相对较弱

应用场景

覆盖研究、生活、数据分析、教育、生产力工具、创意娱乐等 6 大类别 51 个具体用例,如简历筛选、房产筛选、股票分析、旅行规划、教学辅助、销售数据分析等复杂任务场景

可用于开发电商导购机器人等简单 AI 应用,在个人简单创作以及团队利用字节系插件生态进行开发方面有优势,在企业级应用场景中主要用于构建一些基础的 AI 功能

性能表现

在权威的 GAIA 基准测试所有三个难度级别上取得 SOTA 成绩,性能超越 OpenAI 同层次大模型

未提及在权威综合性基准测试中的成绩,主要强调其在特定功能开发场景下的易用性和生态优势

人机协作模式

用户用自然语言描述需求,能快速理解执行,执行中可随时接收新指示,开创高效人机协作新范式

用户通过选择模型、编写 prompt 等方式设定规则让 bot 执行任务,人机交互更多基于用户对 bot 功能的预先设定和调整

Manus与其他类型AI大模型

在功能定位、任务执行能力、技术架构、应用场景、性能表现等方面存在诸多差异,具体对比如下:

对比维度
Manus
其他AI类(如豆包、通义千问、文心一言等)

功能定位

通用型AI Agent,旨在成为用户数字世界的“代理人”,直接交付完整任务成果

多为语言模型,侧重提供语言交互服务,如知识问答、文本创作、翻译等,部分需用户进一步加工处理结果

任务执行能力

能自主规划、执行复杂任务,如筛选简历、规划旅行、分析股票等;可在云端异步运行,不受端侧设备限制;能理解复杂指令,分解任务并调用工具执行

通常根据用户输入生成文本内容,部分具备简单任务处理能力,但在自主规划和执行复杂任务方面相对较弱

技术架构

采用Multiple Agent架构,多个代理协同工作,运行在独立虚拟机中,可调用各类工具

基于深度学习算法,如Transformer架构,通过大规模数据训练学习语言模式和知识

应用场景

覆盖工作、生活多领域复杂任务,如B2B供应商采购、在线商店运营分析等;能处理跨领域综合性任务

在各自擅长领域应用,如办公辅助(通义千问)、中文语言处理(文心一言)、语音交互(讯飞星火),跨领域应用能力有限

性能表现

在GAIA基准测试三个难度级别均取得SOTA成绩,性能超越OpenAI同层次大模型

依据不同评估标准各有优劣,在特定任务或领域表现突出,但缺乏类似GAIA基准测试的统一评估对比

学习与记忆能力

具备自主学习和记忆能力,能记住用户偏好和任务经验,优化后续任务处理

部分模型有一定记忆机制,但自主学习能力相对较弱,难以依据经验显著提升复杂任务处理能力

Manus与DeepSeek

Manus和DeepSeek在功能定位、技术能力、应用场景、技术架构等方面存在诸多差异:

对比维度
Manus

DeepSeek

功能定位

全球首款通用AI Agent产品,旨在成为用户在数字世界的“代理人”,强调直接交付完整任务成果,实现从想法到实践的转化,将用户的需求切实落地

未明确提及自身为通用AI Agent产品,主要致力于通过可操作的智能解决方案,帮助组织挖掘隐藏信息、辅助决策,利用技术手段处理大量网络内容并转化为可操作的建议

技术能力

在GAIA基准测试中,三个难度级别均取得新的最先进(SOTA)表现,性能超越OpenAI同层次大模型;能实现“0.1秒级决策”,任务拆解颗粒度更精细;计划今年晚些时候开源部分模型,特别是推理部分,构建多智能体协作沙盒,通过多智能体协作提升复杂任务处理能力

用3个月实现10倍推理效率提升,在推理效率提升方面成果显著;作为开源和人类智能公司,在数据处理和智能分析方面有自身技术优势,专注于模型层的研究和开发

应用场景

覆盖旅行规划、股票分析、教育内容创作、保险政策比较、供应商采购、财务报告分析、创业公司列表整理、在线商店运营分析等多个领域的复杂任务,能并行完成“爬取财报→编写Python→部署网站”等复杂链路,处理跨领域综合性任务

擅长处理单线程任务,如合同审查;为政府、企业、金融机构、个人等不同主体提供创新智能解决方案,在数据挖掘和决策辅助方面应用较多

技术架构

采用多重签名(multisig)系统,由多个独立模型驱动,运行在独立虚拟机中,能在虚拟环境调用各类工具,如编写和执行代码、浏览网页、操作应用等

未明确披露其详细技术架构,但可知它是基于开源和结合人类智能的技术路线,通过收集网络内容进行分析处理

Manus与Grok3

Manus 和 Grok 3 在多个方面存在差异,具体对比如下:

对比维度
Manus

Grok 3

产品定位

全球首款通用 AI Agent 产品,立志成为用户在数字世界的 “代理人”,能独立思考、规划并执行复杂任务,直接交付完整成果,将用户需求从想法转化为实际落地的成果

xAI 团队研发的第三代大语言模型,使命为 “了解宇宙”,侧重于知识获取、推理及多模态处理,为多领域提供智能化支持,助力用户获得各类信息与解决方案

技术架构

采用多重签名(multisig)系统和 Multiple Agent 架构,由多个独立模型协同驱动,可在虚拟环境中调用各类工具,如编写和执行代码、浏览网页、操作应用等,运行在独立虚拟机内

在孟菲斯超级集群上完成训练,该集群由 10 万块英伟达 H100 GPU 组成,总训练时长达到 2 亿 GPU 小时,计算量较前代 Grok 提升 10 倍。引入 “思维链”(Chain of Thought)技术,模拟人类逐步推理过程,支持文本、图像混合分析

技术能力

在 GAIA 基准测试(评估通用 AI 助手解决现实世界问题能力)的三个难度级别均取得新的最先进(SOTA)表现,性能超越 OpenAI 同层次大模型;可实现 “0.1 秒级决策”,任务拆解更精细

在数学推理、科学逻辑和代码写作等复杂任务中表现出色,全面超越 DeepSeek – R1、GPT – 4o 和 Gemini 2.0 等竞品。多模态能力使其在结合图像和文字信息分析任务中有优势,如根据图表生成报告、图文结合创作故事等

应用场景

覆盖工作与生活多领域复杂任务。旅行规划方面,能整合信息并定制手册;股票分析可深入研究并设计可视化仪表盘;还能进行教育内容创作、保险政策比较、B2B 供应商采购、财务报告分析、创业公司列表整理、在线商店运营分析等,可并行完成 “爬取财报→编写 Python→部署网站” 等复杂链路

航天领域可进行轨道计算模拟;游戏开发中辅助内容创作;信息检索方面帮助用户快速获取信息;智能客服场景理解用户问题并提供解答;内容创作给予灵感与素材;数据分析挖掘数据价值;融入特斯拉生态助力自动驾驶数据训练等

运行方式

完全基于云端异步运行,用户下达指令后可关闭设备,任务完成后自动通知结果,不受端侧设备运行状态限制

未明确表明可完全云端异步运行,可能需用户持续操作设备获取结果,依赖设备实时交互

训练成本与能耗

暂未披露

训练成本约 40 亿美元,单次训练碳排放量相当于 4.6 万辆汽车的年排放量,在模型训练中消耗大量资源。

开源情况

团队计划今年晚些时候开源部分模型,特别是推理部分,并构建多智能体协作沙盒,以促进技术交流与创新

延续马斯克 “彻底开源” 承诺,但因其复杂架构,第三方进行全面审计难度较高,开源的实际落地和应用推广面临挑战

各大网媒报道:

中国AI的范式跃迁

Manus的突破绝非偶然。它既受益于中国完备的数字基建和场景优势,更展现了本土团队从“技术追随”到“定义标准”的转变。尽管前路仍需攻克可靠性、合规性等关卡,但这款完全由中国年轻团队打造的AI智能体,已为全球科技竞赛写下新注脚——未来的AI巅峰之争,中国力量正在崛起。

原创源链接:DocsManus:中国AI创新力,开启通用智能体的新时代插图1https://bl7rsz9526.feishu.cn/wiki/InhXwxkHDiVRpokRsdJczEsOnqc?fromScene=spaceOverview

原文链接:https://blog.csdn.net/YuKeeHgg/article/details/146070052?ops_request_misc=%257B%2522request%255Fid%2522%253A%25220381a4b5a33f751a51e199c020381fd2%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=0381a4b5a33f751a51e199c020381fd2&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-11-146070052-null-null.nonecase&utm_term=manus

相关推荐

阅读榜

hellenandjeckett@outlook.com

加入QQ群:849112589

回顶部