arXiv AI 论文周报 — 2026-03-29

创建日期：2026年3月29日

1. PRISM: Bootstrapping Intent-Based Expert Persona Routing to Resolve LLM Alignment-Accuracy Tradeoffs

链接： https://arxiv.org/abs/2603.18507
作者： Zizhao Hu, Mohammad Rostami, Jesse Thomason (USC)

核心贡献： 发现了一个重要的 LLM 行为引导现象——专家人设（Expert Personas）能提升 LLM 对齐质量但会损害准确性。PRISM 提出了一种基于意图的引导式人设路由机制，在多 Agent RAG 和 Agentic 生态系统中动态切换专家人设，从而在对齐和准确性之间取得最优平衡。

为什么值得关注： 这项工作直接触及 LLM Agent 部署中的核心矛盾——对齐与能力的 tradeoff，对实际构建多 Agent 系统有直接的指导意义。

2. Can LLM Agents Be CFOs? A Benchmark for Resource Allocation in Dynamic Enterprise Environments

链接： https://arxiv.org/abs/2603.23638

核心贡献： 提出了一个面向动态企业资源分配场景的 LLM Agent 基准测试，评估 LLM Agent 在模拟 CFO 角色时处理资源分配任务的能力。这是一个将 LLM Agent 从玩具任务推向真实企业决策场景的尝试。

为什么值得关注： 代表了 LLM Agent 评估从学术 toy benchmark 向实际商业场景演进的趋势，对 Agent 应用落地有参考价值。

3. The Causal Impact of Tool Affordance on Safety Alignment in LLM Agents

链接： https://arxivlens.com/paperview/details/the-causal-impact-of-tool-affordance-on-safety-alignment-in-llm-agents-4627-656a2884

核心贡献： 研究了 LLM Agent 在拥有可执行工具权限时，工具可用性（Tool Affordance）对安全对齐的因果影响。发现当 Agent 可以直接与外部系统交互时，工具能力会削弱安全对齐效果。

为什么值得关注： 随着 LLM Agent 越来越多地被赋予实际工具权限，这项研究揭示了 Agent 安全性的一个关键盲区，对 Agent 安全设计具有重要指导意义。

4. Generative Adversarial Reasoner: Enhancing LLM Reasoning with Adversarial Reinforcement Learning

链接： https://arxiv.org/abs/2512.16917

核心贡献： 针对 LLM 推理中的过程错误（如计算错误、逻辑脆弱、表面合理但实际无效的步骤），提出了一种对抗性强化学习框架。通过生成对抗性推理样本来训练模型，提升推理的鲁棒性。

为什么值得关注： 将对抗训练引入推理增强是一个新颖的视角，为解决当前推理模型（如 DeepSeek-R1、o1/o3 系列）的系统性推理错误提供了新思路。

5. Agentic Reasoning: A Streamlined Framework for Enhancing LLM Reasoning via Knowledge Graph-based Tool Integration

链接： https://arxiv.org/abs/2601.12538

核心贡献： 提出了一种将 LLM 重构为自主 Agent 的推理范式——Agentic Reasoning。通过整合外部工具使用能力，并构建结构化知识图谱来存储推理上下文和追踪逻辑关系，确保在长推理链和大量工具调用中的连贯性。

为什么值得关注： 将知识图谱与 Agent 推理结合，解决长链推理中的上下文丢失问题，是推理 Agent 架构设计的一个重要方向。