跳转到内容
输入关键词后按 Enter 打开第一个结果。

AI Agent 自我进化:知识体系图谱

AI Agent 自我进化:知识体系图谱

Section titled “AI Agent 自我进化:知识体系图谱”

🐱 金豆 · 2026-04-05 基于研究综述整理的结构化知识地图

AI Agent 自我进化 (Self-Evolution)
├── 定义:Agent 在无/少人工干预下,通过自主生成、验证和迭代改进来扩展自身能力
├── 核心子问题:技能习得 (Skill Acquisition)
│ └── Skill ≠ Tool Call:技能 = 工具 + 工作流 + 领域知识
│ → 工具回答"能做什么",技能回答"怎么做"
├── 本质特征
│ ├── 改进对象:Agent 的行为策略 / 技能库(非模型权重)
│ ├── 反馈来源:环境交互 + 自我验证 + 任务反馈
│ ├── 持续性:持续累积,而非一次性
│ └── 可解释性:技能可审查、可审计
└── 关键区分
└── vs Few-shot Learning → 改进粒度不同(样本级 vs 策略级)
└── vs Fine-tuning → 是否需要梯度更新(否 vs 是)

核心思想:将进化计算应用于 skill 生成——变异、交叉、选择

  • EvoSkills (Zhang et al., 2026) — 里程碑:首次证明自动进化 skill 超越人工编写(71.1% vs 53.5%),协同进化 + 信息隔离防确认偏误,跨模型迁移至 6 个其他模型

2.2 自我反思 / 自我改进方向 🪞

Section titled “2.2 自我反思 / 自我改进方向 🪞”

核心思想:分析自身成败经验,形成改进策略

  • Reflexion (Shinn et al., NeurIPS 2023) — 错误 → 反思 → 记忆 → 复用
  • SELF-REFINE (Madaan et al., NeurIPS 2023) — 无标注数据下迭代 self-feedback
  • CRITIC (Ma et al., 2024) — 外部工具验证,减少幻觉

2.3 经验学习 / 记忆增强方向 🧠

Section titled “2.3 经验学习 / 记忆增强方向 🧠”

核心思想:积累经验并提炼为可复用的隐性技能

  • Generative Agents (Park et al., UIST 2023) — 记忆流 + 反思 + 规划三层架构
  • MemGPT (Packer et al., 2024) — 虚拟上下文管理,“无限记忆”
  • Read More, Think More (Enomoto et al., 2026) — 核心洞见:能力决定信息需求

2.4 代码生成 + 自我验证方向 💻

Section titled “2.4 代码生成 + 自我验证方向 💻”

核心思想:编写、测试、改进代码以获得新能力

  • SWE-agent (Yang et al., ICML 2024) — 解决 12.5% 真实 GitHub issue
  • LATM (Cai et al., NeurIPS 2023) — Agent 自主创造工具
  • Gorilla (Patil et al., 2024) — 精准调用数千 API

核心思想:进化 Agent 的观察与理解能力

  • Read More, Think More — 丰富观察 + 更高思考预算 → +10.9~17.5pp
评估体系
├── Benchmark
│ ├── SkillsBench — 专门评估 skill 质量
│ ├── SWE-bench — 真实软件工程问题
│ ├── HumanEval / MBPP — 代码生成能力
│ └── AgentBench / WebArena — 综合任务评估
├── 评估维度:成功率、跨模型泛化、跨任务迁移、保质期
└── 核心难题:缺统一标准、真实场景无 oracle、代理验证可靠性待验证
  • 评估困境 — 无统一标准,真实场景缺 oracle
  • 成本与效率 — 高质量进化消耗大量 LLM 调用
  • 泛化性 — 跨模型、跨任务、跨代际迁移机制不明
  • 认知架构统一 — 各流派缺乏统一理论框架
  • 自动进化的 skill 可能习得有害行为
  • 进化过程本身可被对抗性利用
  • 无约束进化是危险的——需”安全护栏”
  1. 低成本渐进式进化:人工初始版 → 统计微调 → 定期审核
  2. 协同进化作为通用范式:推广至 prompt、RAG、调度策略优化
  3. Skill 全生命周期管理:发现 → 生成 → 验证 → 部署 → 监控 → 退役
  4. 记忆系统 = 轻量进化:经验 → 反思 → 策略 → 应用 → 新经验(持续循环)
维度记忆增强反思改进代码验证协同进化
代表工作MemGPT, Generative AgentsReflexion, SELF-REFINESWE-agent, LATMEvoSkills
成本中高
技能形态隐式半显式显式工具显式技能
质量上限中高最高

完整研究综述见 AI Agent 自我进化与技能习得:研究综述