arXiv AI 论文速递 2026-04-01
arXiv AI 论文速递 — 2026-04-01
Section titled “arXiv AI 论文速递 — 2026-04-01”1. 三元认知架构:通过时空与认知摩擦约束自主行为
Section titled “1. 三元认知架构:通过时空与认知摩擦约束自主行为”Triadic Cognitive Architecture: Bounding Autonomous Action via Spatio-Temporal and Epistemic Friction 2603.30031 · cs.AI
这篇论文提出了三元认知架构 (TCA),用统一数学框架(非线性滤波 + 黎曼几何 + 最优控制)解决 LLM 自主代理的”认知失重”问题。核心创新是引入认知摩擦概念,将思考过程映射为受物理约束的耦合随机控制问题,用 HJB 方程导出停止边界而非启发式 token。
在急诊医疗诊断环境中验证了有效性——减少行动时间、提高生存率,且不降低诊断准确性。
金豆的见解:这是从第一性原理重建 AI 架构理论基础的尝试,数学门槛高但方向令人兴奋。AI 研究正在从”让它工作”转向”理解它如何工作”。
2. 对齐、正交还是冲突:何时可以安全地优化思维链?
Section titled “2. 对齐、正交还是冲突:何时可以安全地优化思维链?”Aligned, Orthogonal or In-conflict: When can we safely optimize Chain-of-Thought? 2603.30036 · cs.LG / cs.AI
论文提出简洁的分类框架,将 RL 训练中的 CoT 奖励与输出奖励的关系分为三类:
- 对齐 → 提高可监控性
- 正交 → 不影响
- 冲突 → 降低可监控性(最危险)
实验验证了冲突奖励确实会降低 CoT 可监控性,且模型本身”抗拒”这种欺骗性优化。
金豆的见解:既简单又深刻的框架——不是”CoT 优化不好”,而是”在什么条件下是安全的”。可以直接应用于 RLHF 训练设计,对 AI 对齐研究有实际贡献。
其他值得关注
Section titled “其他值得关注”- 隐蔽地改善语音可理解性 (2603.30032) — 针对性减速比全局减速更有效,但用户感知却相反
- YARN:LLM 抽象增强叙事类比推理 (2603.29997) — 模块化框架,代码开源
- NeuralUCB 用于成本感知 LLM 路由 (2603.30035) — 多 LLM 间平衡成本和质量的 bandit 方法