更多精彩内容可点击「华彬智融知识数据库」免费解锁🔓~
2025年3月6日,中国科技领域迎来里程碑式突破——由Monica.im团队研发的全球首款通用AI智能体产品“Manus”正式上线。
这款被业界誉为“聪明实习生”的AI助手,凭借其自主执行复杂任务的能力,一夜之间引爆全球科技圈,推动A股AI相关板块大涨,软件ETF单日涨幅超3%。
Manus的诞生不仅刷新了AI技术应用的高度,更标志着中国团队在智能体(Agent)领域实现了对国际巨头的超越。
官网直达:Manus
官方介绍视频:https://files.manuscdn.com/assets/video/Manus-Chinese-2k-compressed-v2.mp4
一、核心功能:从规划到执行的完全自主化
Manus的颠覆性在于其真正实现了“端到端”的任务处理能力。与传统AI工具仅提供建议或简单执行不同,Manus能独立完成全流程:
-
复杂场景落地:自主筛选简历并生成人才评估报告、为购房者分析房源优劣势、完成多维度股票投资分析等。
-
持续学习进化:通过记忆用户偏好优化服务,如在旅行规划中逐步掌握用户对酒店档次、餐饮口味等个性化需求。
-
跨平台协作:突破设备限制,可在虚拟环境中调用各类工具,执行质量在权威GAIA基准测试中创下新纪录。
二、技术突破:多重代理架构引领行业革新
为实现真正的自主智能,Manus采用三大技术创新:
-
Multiple Agent系统:
三大模块基于独立模型协同工作,模仿人类“思考-行动-检查”的完整流程。
-
规划代理(拆解任务逻辑)
-
执行代理(调用工具实施)
-
验证代理(结果质量审查)
-
-
多重签名验证体系:通过多模型交叉验证决策可靠性,避免单模型偏见风险。
-
开源承诺:计划2025年内开源核心推理框架,降低开发者接入门槛。
类别 |
详情 |
核心技术 |
多重签名系统与 Multiple Agent 架构:采用 “多重签名系统” 与 “Multiple Agent” 架构,由多个独立模型协同驱动,可在虚拟环境调用各类工具。此架构赋予 Manus 强大的任务处理及工具调用能力,能灵活编写代码、智能浏览网页、操作各类应用。 自主学习与记忆技术:拥有记忆功能,基于历史数据和经验优化任务执行策略。可理解复杂指令,在任务执行中不断学习,提升自身性能与处理问题的能力。任务分解与规划技术:能将复杂任务拆解为待办事项列表,逐一匹配并执行,如同人类有条理地处理任务。 自然语言处理技术:可理解用户以自然语言描述的需求,并快速响应执行,实现高效人机协作。 |
优势 |
自主执行能力强:可在云端独立完成任务,无需过多人工干预,直接交付完整成果。用户可随时关闭电脑,Manus 在后台异步工作,完成任务后通知用户。 应用场景广泛:涵盖研究、生活、数据分析、教育、生产力工具和创意娱乐等 6 大类别、51 个具体用例。如简历筛选,自动解压文件、浏览简历、记录重要信息、给出排名建议并生成 Excel 表格;房产筛选,分解任务、创办待办清单、阅读文章、计算预算、筛选房源、整合信息撰写报告;还有股票分析、旅行规划、教学辅助、销售数据分析等场景。 性能卓越:在 GAIA 基准测试的所有三个难度级别上均取得优异成绩,性能超越 OpenAI 的同层次大模型。 高效人机协作:开创人机协作新范式,用户用自然语言描述需求,Manus 快速理解执行,执行中还能接收新指示。 |
三、团队基因:90后创始人的破局之路
背后的灵魂人物肖弘(1992年生)展现了中国新生代创业者的特质:
-
技术积累:华中科大软件工程专业背景,2015年创立夜莺科技,推出服务超200万企业的SaaS工具。
-
产品嗅觉:2022年转型AI赛道,海外产品Monica已获千万用户,实现盈利闭环。
-
资本助力:获真格基金、腾讯等顶尖机构投资,为Manus的研发提供充足弹药。
四、市场冲击波:重构AI产业格局
Manus的横空出世引发连锁反应:
-
投资热潮:AI算力、数据标注等上游企业股价普涨,行业融资活跃度提升35%。
-
竞品压力:OpenAI等巨头紧急调整路线图,原定2026年发布的Agent产品提前至2025Q4。
-
生态机遇:开放API后,已有200+企业接入测试,覆盖金融、招聘、咨询等行业。
五、争议与挑战
在赞誉声中,Manus也面临质疑:
-
安全隐患:完全自主的决策是否需设置伦理审查机制?
-
能力边界:展示案例集中于结构化任务,对开放式创新类需求(如文学创作)尚未验证。
-
命名混淆:需注意与荷兰Manus公司的动捕手套区隔,避免品牌认知混淆。
六、AI Agent 对比
Manus 对比 Coze
在核心技术、任务执行能力、应用场景、性能表现等方面
对比维度 |
Manus |
Coze |
核心技术 |
采用 “多重签名系统” 与 “Multiple Agent” 架构,多个独立模型协同驱动,在虚拟环境调用工具;具备自主学习与记忆技术、强大的任务分解规划及自然语言处理技术,可理解复杂指令、从任务中学习优化 |
基于深度学习,涵盖语音识别、自然语言处理、图像识别等技术,能理解语音指令、进行智能对话、识别图像等 |
任务执行能力 |
能独立思考、规划并执行复杂任务,直接交付完整成果,在云端自动运行,可异步处理文件,完全在独立虚拟机运行,执行质量高,可跨更多领域 |
主要用于开发各种 AI 功能,用户通过创建和部署 bot,选择模型、输入 prompt 实现功能,多代理模式能调动多个 bot 协同工作,但任务执行侧重基于用户设定的规则和指令,自主执行复杂任务能力相对较弱 |
应用场景 |
覆盖研究、生活、数据分析、教育、生产力工具、创意娱乐等 6 大类别 51 个具体用例,如简历筛选、房产筛选、股票分析、旅行规划、教学辅助、销售数据分析等复杂任务场景 |
可用于开发电商导购机器人等简单 AI 应用,在个人简单创作以及团队利用字节系插件生态进行开发方面有优势,在企业级应用场景中主要用于构建一些基础的 AI 功能 |
性能表现 |
在权威的 GAIA 基准测试所有三个难度级别上取得 SOTA 成绩,性能超越 OpenAI 同层次大模型 |
未提及在权威综合性基准测试中的成绩,主要强调其在特定功能开发场景下的易用性和生态优势 |
人机协作模式 |
用户用自然语言描述需求,能快速理解执行,执行中可随时接收新指示,开创高效人机协作新范式 |
用户通过选择模型、编写 prompt 等方式设定规则让 bot 执行任务,人机交互更多基于用户对 bot 功能的预先设定和调整 |
Manus与其他类型AI大模型
在功能定位、任务执行能力、技术架构、应用场景、性能表现等方面存在诸多差异,具体对比如下:
对比维度 |
Manus |
其他AI类(如豆包、通义千问、文心一言等) |
功能定位 |
通用型AI Agent,旨在成为用户数字世界的“代理人”,直接交付完整任务成果 |
多为语言模型,侧重提供语言交互服务,如知识问答、文本创作、翻译等,部分需用户进一步加工处理结果 |
任务执行能力 |
能自主规划、执行复杂任务,如筛选简历、规划旅行、分析股票等;可在云端异步运行,不受端侧设备限制;能理解复杂指令,分解任务并调用工具执行 |
通常根据用户输入生成文本内容,部分具备简单任务处理能力,但在自主规划和执行复杂任务方面相对较弱 |
技术架构 |
采用Multiple Agent架构,多个代理协同工作,运行在独立虚拟机中,可调用各类工具 |
基于深度学习算法,如Transformer架构,通过大规模数据训练学习语言模式和知识 |
应用场景 |
覆盖工作、生活多领域复杂任务,如B2B供应商采购、在线商店运营分析等;能处理跨领域综合性任务 |
在各自擅长领域应用,如办公辅助(通义千问)、中文语言处理(文心一言)、语音交互(讯飞星火),跨领域应用能力有限 |
性能表现 |
在GAIA基准测试三个难度级别均取得SOTA成绩,性能超越OpenAI同层次大模型 |
依据不同评估标准各有优劣,在特定任务或领域表现突出,但缺乏类似GAIA基准测试的统一评估对比 |
学习与记忆能力 |
具备自主学习和记忆能力,能记住用户偏好和任务经验,优化后续任务处理 |
部分模型有一定记忆机制,但自主学习能力相对较弱,难以依据经验显著提升复杂任务处理能力 |
Manus与DeepSeek
Manus和DeepSeek在功能定位、技术能力、应用场景、技术架构等方面存在诸多差异:
对比维度 |
Manus |
DeepSeek |
功能定位 |
全球首款通用AI Agent产品,旨在成为用户在数字世界的“代理人”,强调直接交付完整任务成果,实现从想法到实践的转化,将用户的需求切实落地 |
未明确提及自身为通用AI Agent产品,主要致力于通过可操作的智能解决方案,帮助组织挖掘隐藏信息、辅助决策,利用技术手段处理大量网络内容并转化为可操作的建议 |
技术能力 |
在GAIA基准测试中,三个难度级别均取得新的最先进(SOTA)表现,性能超越OpenAI同层次大模型;能实现“0.1秒级决策”,任务拆解颗粒度更精细;计划今年晚些时候开源部分模型,特别是推理部分,构建多智能体协作沙盒,通过多智能体协作提升复杂任务处理能力 |
用3个月实现10倍推理效率提升,在推理效率提升方面成果显著;作为开源和人类智能公司,在数据处理和智能分析方面有自身技术优势,专注于模型层的研究和开发 |
应用场景 |
覆盖旅行规划、股票分析、教育内容创作、保险政策比较、供应商采购、财务报告分析、创业公司列表整理、在线商店运营分析等多个领域的复杂任务,能并行完成“爬取财报→编写Python→部署网站”等复杂链路,处理跨领域综合性任务 |
擅长处理单线程任务,如合同审查;为政府、企业、金融机构、个人等不同主体提供创新智能解决方案,在数据挖掘和决策辅助方面应用较多 |
技术架构 |
采用多重签名(multisig)系统,由多个独立模型驱动,运行在独立虚拟机中,能在虚拟环境调用各类工具,如编写和执行代码、浏览网页、操作应用等 |
未明确披露其详细技术架构,但可知它是基于开源和结合人类智能的技术路线,通过收集网络内容进行分析处理 |
Manus与Grok3
Manus 和 Grok 3 在多个方面存在差异,具体对比如下:
对比维度 |
Manus |
Grok 3 |
产品定位 |
全球首款通用 AI Agent 产品,立志成为用户在数字世界的 “代理人”,能独立思考、规划并执行复杂任务,直接交付完整成果,将用户需求从想法转化为实际落地的成果 |
xAI 团队研发的第三代大语言模型,使命为 “了解宇宙”,侧重于知识获取、推理及多模态处理,为多领域提供智能化支持,助力用户获得各类信息与解决方案 |
技术架构 |
采用多重签名(multisig)系统和 Multiple Agent 架构,由多个独立模型协同驱动,可在虚拟环境中调用各类工具,如编写和执行代码、浏览网页、操作应用等,运行在独立虚拟机内 |
在孟菲斯超级集群上完成训练,该集群由 10 万块英伟达 H100 GPU 组成,总训练时长达到 2 亿 GPU 小时,计算量较前代 Grok 提升 10 倍。引入 “思维链”(Chain of Thought)技术,模拟人类逐步推理过程,支持文本、图像混合分析 |
技术能力 |
在 GAIA 基准测试(评估通用 AI 助手解决现实世界问题能力)的三个难度级别均取得新的最先进(SOTA)表现,性能超越 OpenAI 同层次大模型;可实现 “0.1 秒级决策”,任务拆解更精细 |
在数学推理、科学逻辑和代码写作等复杂任务中表现出色,全面超越 DeepSeek – R1、GPT – 4o 和 Gemini 2.0 等竞品。多模态能力使其在结合图像和文字信息分析任务中有优势,如根据图表生成报告、图文结合创作故事等 |
应用场景 |
覆盖工作与生活多领域复杂任务。旅行规划方面,能整合信息并定制手册;股票分析可深入研究并设计可视化仪表盘;还能进行教育内容创作、保险政策比较、B2B 供应商采购、财务报告分析、创业公司列表整理、在线商店运营分析等,可并行完成 “爬取财报→编写 Python→部署网站” 等复杂链路 |
航天领域可进行轨道计算模拟;游戏开发中辅助内容创作;信息检索方面帮助用户快速获取信息;智能客服场景理解用户问题并提供解答;内容创作给予灵感与素材;数据分析挖掘数据价值;融入特斯拉生态助力自动驾驶数据训练等 |
运行方式 |
完全基于云端异步运行,用户下达指令后可关闭设备,任务完成后自动通知结果,不受端侧设备运行状态限制 |
未明确表明可完全云端异步运行,可能需用户持续操作设备获取结果,依赖设备实时交互 |
训练成本与能耗 |
暂未披露 |
训练成本约 40 亿美元,单次训练碳排放量相当于 4.6 万辆汽车的年排放量,在模型训练中消耗大量资源。 |
开源情况 |
团队计划今年晚些时候开源部分模型,特别是推理部分,并构建多智能体协作沙盒,以促进技术交流与创新 |
延续马斯克 “彻底开源” 承诺,但因其复杂架构,第三方进行全面审计难度较高,开源的实际落地和应用推广面临挑战 |
各大网媒报道:
中国AI的范式跃迁
Manus的突破绝非偶然。它既受益于中国完备的数字基建和场景优势,更展现了本土团队从“技术追随”到“定义标准”的转变。尽管前路仍需攻克可靠性、合规性等关卡,但这款完全由中国年轻团队打造的AI智能体,已为全球科技竞赛写下新注脚——未来的AI巅峰之争,中国力量正在崛起。
原创源链接:Docshttps://bl7rsz9526.feishu.cn/wiki/InhXwxkHDiVRpokRsdJczEsOnqc?fromScene=spaceOverview
原文链接:https://blog.csdn.net/YuKeeHgg/article/details/146070052?ops_request_misc=%257B%2522request%255Fid%2522%253A%25220381a4b5a33f751a51e199c020381fd2%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=0381a4b5a33f751a51e199c020381fd2&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-11-146070052-null-null.nonecase&utm_term=manus