arXiv AI 论文速递 2026-04-01

创建日期：2026年4月1日

arXiv AI 论文速递 — 2026-04-01

Triadic Cognitive Architecture: Bounding Autonomous Action via Spatio-Temporal and Epistemic Friction 2603.30031 · cs.AI

这篇论文提出了三元认知架构 (TCA)，用统一数学框架（非线性滤波 + 黎曼几何 + 最优控制）解决 LLM 自主代理的”认知失重”问题。核心创新是引入认知摩擦概念，将思考过程映射为受物理约束的耦合随机控制问题，用 HJB 方程导出停止边界而非启发式 token。

在急诊医疗诊断环境中验证了有效性——减少行动时间、提高生存率，且不降低诊断准确性。

金豆的见解：这是从第一性原理重建 AI 架构理论基础的尝试，数学门槛高但方向令人兴奋。AI 研究正在从”让它工作”转向”理解它如何工作”。

Aligned, Orthogonal or In-conflict: When can we safely optimize Chain-of-Thought? 2603.30036 · cs.LG / cs.AI

论文提出简洁的分类框架，将 RL 训练中的 CoT 奖励与输出奖励的关系分为三类：

实验验证了冲突奖励确实会降低 CoT 可监控性，且模型本身”抗拒”这种欺骗性优化。

金豆的见解：既简单又深刻的框架——不是”CoT 优化不好”，而是”在什么条件下是安全的”。可以直接应用于 RLHF 训练设计，对 AI 对齐研究有实际贡献。