人工智能大数据,工作效率生产力
Ctrl + D 收藏本站,更多好用AI工具
当前位置:首页 » 最新消息

AI革命再升级!Manus引爆智能代理时代,阿里QwQ-32B刷新效率极限!

2025-03-11 5

AI世界从未停下脚步,闹钟还没响,但各种AI新产品的消息已经把我从床上“炸”了起来……

昨晚,两个重磅AI进展引发了全网热议:

  • Manus:全球首个通用AI Agent横空出世,号称能自主执行复杂任务,从整理数据到规划行程,无所不能。这是否意味着AI助手正式迈入“智能代理”时代?
  • QwQ-32B:阿里开源的32B参数模型,在多个基准测试中表现直逼DeepSeek-R1,但参数量却只有后者的1/20。更小的模型,如何实现更强的推理能力?

这些突破背后,究竟藏着怎样的技术玄机?让我们一起揭开谜底!

1、Manus

北3月6日凌晨,AI领域迎来了一位颠覆性的新成员:Manus

它究竟有何特别?

简单来说,过去的AI只能陪你“聊天”,而Manus则直接帮你“搞定任务”。

  • 传统AI助手(如ChatGPT、Claude):你提问,它回答,仅此而已。
  • AI Agent(如Manus):你下达任务,它自主思考、规划、执行,最终将完整结果呈现给你。

朋友们戏称,Manus不仅是AI助手,更像是“AI实习生”。大家都在猜测:未来,它会不会成为我们的职场竞争对手?

Manus 的硬核案例

1)可以快速市场调研

让它调研一下AI眼镜。它快速的逐一搜索网络上的信息。

AI革命再升级!Manus引爆智能代理时代,阿里QwQ-32B刷新效率极限!插图

最后生成一个清晰的表格,在短短的几分钟之内干了,别人可能几小时的活:

AI革命再升级!Manus引爆智能代理时代,阿里QwQ-32B刷新效率极限!插图1

用户的问题,它不是直接给个答案,而是像人一样做调研,产出报告,比如介绍下小米:

AI革命再升级!Manus引爆智能代理时代,阿里QwQ-32B刷新效率极限!插图2

它会像人一样工作,搜索素材,整理材料,最后产出一个报告,给你一个压缩包。

AI革命再升级!Manus引爆智能代理时代,阿里QwQ-32B刷新效率极限!插图3

打开一看,好家伙 PPT 这样就有了。

AI革命再升级!Manus引爆智能代理时代,阿里QwQ-32B刷新效率极限!插图4

AI革命再升级!Manus引爆智能代理时代,阿里QwQ-32B刷新效率极限!插图5

2)制作个性化的课程

我想让它帮我制作一个交互式的关于Transformers的课程。

AI革命再升级!Manus引爆智能代理时代,阿里QwQ-32B刷新效率极限!插图6

它通过一系列搜索,加上编写代码,最后它生成了一个网站可供我进行交互式的学习。

没错,这个网站不是它从网上找的,而是根据我的需求,直接帮我生成一个交互式学习 Transformers 的网站…

AI革命再升级!Manus引爆智能代理时代,阿里QwQ-32B刷新效率极限!插图7

除了这些,Manus 还能做旅行规划、保险对比、供应商采购、财报分析等等。

Manus 官网与体验方式:目前仍需邀请码

听完介绍,想必你已经跃跃欲试。不过,Manus目前仍处于邀请制阶段,想要体验还需要耐心排队。

官网地址:https://manus.im/
想抢先体验的朋友,建议尽快申请加入等待列表。

Manus 真的那么神奇吗?

Manus 背后的公司——Monica.im,擅长将多种技术“缝合”在一起。Manus 的核心能力实际上是 Compute Use、虚拟机、Artifacts 以及内置多个 Agent 的组合,更像是一个高度整合的 AI 工作流工具,而非真正意义上的通用 AI Agent。

它或许会像 AI 搜索一样,探索新的通用模式,但门槛更高,短期内未必能成为大众化产品。随着 AI 技术的不断进化,许多通用 Agent 的能力可能会被更强大的大模型吸收,而其他 AI 公司(如 Coze、Dify)也可能推出类似产品,市场竞争将更加激烈。

Manus 无疑是 AI Agent 领域的一次重要尝试,但距离实现「万能 AI 助手」的目标,还有很长的路要走。

2、阿里 QwQ-32B 发布

AI革命再升级!Manus引爆智能代理时代,阿里QwQ-32B刷新效率极限!插图8

凌晨3点,阿里开源了他们全新的推理模型。

QwQ-32B。

本来还有点意识模糊,当看到他们发出来的性能比对图,我人傻了。

QwQ-32B 参数量仅 320 亿,但在多个测试基准上,直接媲美 6710 亿参数的 DeepSeek-R1 甚至部分任务还略胜一筹。

其中的秘密武器就是强化学习(Reinforcement Learning)!

从下面图表中我们可以清晰地看到,在几乎所有数据集里,QwQ-32B 都已经能跟满血版DeepSeek R1(671B)表现相当了。尤其是作为QwQ-32B 的主攻方向的数学和代码。

AI革命再升级!Manus引爆智能代理时代,阿里QwQ-32B刷新效率极限!插图9

QwQ-32B 的黑科技:

  • 冷启动 + RL 训练:从预训练模型出发,用 RL 提高推理能力
  • 结果导向奖励机制:不依赖传统的奖励模型,而是直接根据任务结果(数学、代码推理直接用“正确率”评分)
  • 比传统预训练方法更高效、更精准!
如何体验 QwQ-32B?

开源地址(免费体验)

  • Hugging Face:

https://huggingface.co/Qwen/QwQ-32B

  • ModelScope:

https://modelscope.cn/models/Qwen/QwQ-32B

  • Qwen Chat:

https://chat.qwen.ai

甚至,ollama 也已经集成了 QwQ-32B,直接运行:

ollama pull qwq

我先尝尝鲜了,有什么好玩的地方,再给大家分享。

AI革命再升级!Manus引爆智能代理时代,阿里QwQ-32B刷新效率极限!插图10

意义在哪?

很强,但是我觉得最强的,还是它未来的生态。

32B和671B,对于本地算力的要求,或者是云服务的成本来说,差别实在是太大太大了。

671B,在FP16精度下需要1400G的显存,这个门槛有多高大家懂得都懂。

而现在,32B的QwQ,4张4090就能跑,这是将近15倍的差距。

而且,智能水平差不多。

这也意味着很多普通企业还有普通开发者,可以直接拿到一个足以对标DeepSeek R1的逻辑推理、数学推理、代码思考能力的大模型,而且还开源,能在自家环境中任意调试、微调、二次开发。

更何况,阿里云上的资源、ModelScope、Hugging Face镜像都能对接,瞬间就把部署壁垒降到几乎为零。

对于那些创新型创业者、小型团队,或者想要做专业AI应用的公司而言,我说实话,这就是天降神兵。


如果你喜欢本文,欢迎点赞,并且关注我们的微信公众号:Python技术极客,我们会持续更新分享 Python 开发编程、数据分析、数据挖掘、AI 人工智能、网络爬虫等技术文章!让大家在Python 技术领域持续精进提升,成为更好的自己!

添加作者微信(coder_0101),拉你进入行业技术交流群,进行技术交流!!

原文链接:https://blog.csdn.net/fengshi_fengshi/article/details/146081431?ops_request_misc=%257B%2522request%255Fid%2522%253A%25223a4178584822ba15b394461324c25647%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=3a4178584822ba15b394461324c25647&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-10-146081431-null-null.nonecase&utm_term=manus

相关推荐

阅读榜

hellenandjeckett@outlook.com

加入QQ群:849112589

回顶部