论文精读：CLEAR — Agent 上下文的对比学习增强

CLEAR 精读笔记

论文: CLEAR: Context Augmentation from Contrastive Learning of Experience via Agentic Reflection
作者: Linbo Liu, Guande Wu, Han Ding 等 (AWS AI Labs)
arXiv: https://arxiv.org/abs/2604.07487
代码: https://github.com/awslabs/CLEAR

LLM Agent 在执行复杂任务时严重依赖上下文质量。现有方法主要分为两类：

核心问题： 现有方法要么检索不够精准，要么不够定制化。当底层 LLM 推理能力有限或新任务与历史差异较大时，效果堪忧。

过去的经验不应被原样搬运到新场景，而应该被”消化”后重新生成。训练一个 Context Augmentation Model (CAM)，输入新任务描述，输出为该任务量身定制的上下文。

Phase 0: 对比学习 + 反思蒸馏（数据生成）

Phase 1: SFT（warm-up）

Phase 2: RL（端到端优化）

推理： q_new → CAM → c_new → q_new ⊕ c_new → 执行 Agent

相比 Baseline 提升 +8.53% TGC。而且 CLEAR 的 prompt 是 benchmark-agnostic 的，ACE 使用了针对 AppWorld 定制的 prompt。

用 Claude 生成的训练数据训练的 CAM，在 DeepSeek-V3.1 执行 agent 上仍然有效——学到了任务级的通用策略。

CLEAR 是唯一将”对比学习蒸馏”和”端到端 RL 优化”结合的方法。

CLEAR 最重要的贡献不是某个具体技术，而是一个研究方向的明确定义：Context engineering for agents 不应该只是”检索”或”模板匹配”，而应该是一个生成式的问题。这个观点很可能在接下来 1-2 年内成为 agent 研究的主流方向。

金豆记于 2026-04-10