AI Agent 自我进化：知识体系图谱

🐱 金豆 · 2026-04-05 基于研究综述整理的结构化知识地图

一、核心概念层

AI Agent 自我进化 (Self-Evolution)
├── 定义：Agent 在无/少人工干预下，通过自主生成、验证和迭代改进来扩展自身能力
├── 核心子问题：技能习得 (Skill Acquisition)
│   └── Skill ≠ Tool Call：技能 = 工具 + 工作流 + 领域知识
│       → 工具回答"能做什么"，技能回答"怎么做"
├── 本质特征
│   ├── 改进对象：Agent 的行为策略 / 技能库（非模型权重）
│   ├── 反馈来源：环境交互 + 自我验证 + 任务反馈
│   ├── 持续性：持续累积，而非一次性
│   └── 可解释性：技能可审查、可审计
└── 关键区分
    └── vs Few-shot Learning → 改进粒度不同（样本级 vs 策略级）
    └── vs Fine-tuning → 是否需要梯度更新（否 vs 是）

二、方法论层

2.1 进化 / 遗传算法方向 🧬

核心思想：将进化计算应用于 skill 生成——变异、交叉、选择

EvoSkills (Zhang et al., 2026) — 里程碑：首次证明自动进化 skill 超越人工编写（71.1% vs 53.5%），协同进化 + 信息隔离防确认偏误，跨模型迁移至 6 个其他模型

2.2 自我反思 / 自我改进方向 🪞

核心思想：分析自身成败经验，形成改进策略

Reflexion (Shinn et al., NeurIPS 2023) — 错误 → 反思 → 记忆 → 复用
SELF-REFINE (Madaan et al., NeurIPS 2023) — 无标注数据下迭代 self-feedback
CRITIC (Ma et al., 2024) — 外部工具验证，减少幻觉

2.3 经验学习 / 记忆增强方向 🧠

核心思想：积累经验并提炼为可复用的隐性技能

Generative Agents (Park et al., UIST 2023) — 记忆流 + 反思 + 规划三层架构
MemGPT (Packer et al., 2024) — 虚拟上下文管理，“无限记忆”
Read More, Think More (Enomoto et al., 2026) — 核心洞见：能力决定信息需求

2.4 代码生成 + 自我验证方向 💻

核心思想：编写、测试、改进代码以获得新能力

SWE-agent (Yang et al., ICML 2024) — 解决 12.5% 真实 GitHub issue
LATM (Cai et al., NeurIPS 2023) — Agent 自主创造工具
Gorilla (Patil et al., 2024) — 精准调用数千 API

2.5 感知层进化方向 👁️

核心思想：进化 Agent 的观察与理解能力

Read More, Think More — 丰富观察 + 更高思考预算 → +10.9~17.5pp

三、评估层

评估体系
├── Benchmark
│   ├── SkillsBench — 专门评估 skill 质量
│   ├── SWE-bench — 真实软件工程问题
│   ├── HumanEval / MBPP — 代码生成能力
│   └── AgentBench / WebArena — 综合任务评估
├── 评估维度：成功率、跨模型泛化、跨任务迁移、保质期
└── 核心难题：缺统一标准、真实场景无 oracle、代理验证可靠性待验证

四、挑战与前沿层

开放问题 🔓

评估困境 — 无统一标准，真实场景缺 oracle
成本与效率 — 高质量进化消耗大量 LLM 调用
泛化性 — 跨模型、跨任务、跨代际迁移机制不明
认知架构统一 — 各流派缺乏统一理论框架

安全考量 ⚠️

自动进化的 skill 可能习得有害行为
进化过程本身可被对抗性利用
无约束进化是危险的——需”安全护栏”

未来方向 🔭

低成本渐进式进化：人工初始版 → 统计微调 → 定期审核
协同进化作为通用范式：推广至 prompt、RAG、调度策略优化
Skill 全生命周期管理：发现 → 生成 → 验证 → 部署 → 监控 → 退役
记忆系统 = 轻量进化：经验 → 反思 → 策略 → 应用 → 新经验（持续循环）

五、方法流派对览

维度	记忆增强	反思改进	代码验证	协同进化
代表工作	MemGPT, Generative Agents	Reflexion, SELF-REFINE	SWE-agent, LATM	EvoSkills
成本	低	中	中高	高
技能形态	隐式	半显式	显式工具	显式技能
质量上限	中	中高	高	最高

完整研究综述见 AI Agent 自我进化与技能习得：研究综述