出发点:2024年关于AI Agent(人工智能体)的信息漫天飞,急切需要形成初步认知。
0、提纲:
- 了解AI Agent
- 入门示例
- 开源方案
1、了解AI Agent
定义
AI Agent(人工智能体)是一种能够感知环境、自主决策和执行动作的智能实体。
【参考精简的决策流程:感知(Perception)→ 规划(Planning)→ 行动(Action)】
工作模式
人类与AI协同的三种模式
AI Agent工作模式
基础框架
AI Agent基础框架图
几个观点
- Agent==人,包含:大脑(LLM、Planning、Memory)、肢体(Tools、Action)。
- AI Agent的具体实现可繁可简,满足交互性与目标导向性(解决某类通用问题),即可称为“智能体”。
- 吴恩达曾表示:“基于GPT-3.5构建的智能体工作流在应用中表现比GPT-4更好”。
- 在 LLM 大模型没有进一步重大突破之前,AI Agent 将是一个重要发展方向。通过组合工具及规划能力,自动执行任务、提高效率,从而减少人类的劳动负担,实现「降本增效」。
- 即使是最先进的「Single-Agent」系统,也仍然难以完成需要导航不同上下文和管理依赖项的多步骤任务,这正是「Multi-Agents」系统的用武之地。【后续会专题讲Multi-Agent System(MAS)】
- 2024年3月1日,微软团队在具有挑战性的 GAIA 基准测试上进行的首次 AutoGen multi-agent experiment 在所有三个级别中都取得了第一的准确性。
2、入门示例
工作范式
工作机制范式
一个好示例
- 搭建AI机器人的工作流程:站内信息整合->创建知识库(RAG)->创建工作流->编写Bot提示词->调试、优化->发布
- 工作流的节点包括:开始->知识库->大模型(涉及编写“提示词”、含“角色/任务/技能/约束”)->结束
3、开源方案
参考流行度、社区成熟度,梳理出以下GitHub项目,后续拆解。
GitHub名称 | Star数 | 介绍 |
---|---|---|
microsoft/autogen | 30.4k | Multi-Agent对话框架、社区成熟 |
langchain-ai/langchain | 91.9k | 基于LLM的应用、开山基座 |
langgenius/dify | 44k | 直观易用、功能全、流行度高 |
labring/FastGPT | 16.7k | 中文效果好、支持工作流 |
原文链接:https://blog.csdn.net/vison20080808/article/details/143230472?ops_request_misc=%257B%2522request%255Fid%2522%253A%25220251ff955bfe2b3ce8e23e5ac1af9288%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=0251ff955bfe2b3ce8e23e5ac1af9288&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-21-143230472-null-null.nonecase&utm_term=AI+AIAgent
评论 ( 0 )