Dynamic Belief Graphs:用图模型理解 AI 的"心理理论"
LLM 做 Theory of Mind (ToM) 推理时,现有方法把信念当静态独立变量处理。但人类信念实际上是:
- 动态的:随新观察不断演化
- 相互依赖的:信念之间会互相强化或抑制
- 稀疏决策:行动很少,且往往延迟触发
动态信念图框架
Section titled “动态信念图框架”将认知过程形式化为:观察 → 信念状态(动态因子图)→ 行动
用 MRF(马尔可夫随机场)表示信念转移:unary potentials 编码单个信念,pairwise potentials 编码信念间的交互。
语义到势函数的投影
Section titled “语义到势函数的投影”最核心的创新:用 frozen LLM 提取语义嵌入,投影到概率图模型的势函数:
- Unary potentials:对比学习锚定语义方向
- Pairwise potentials:LLM 提取信念对的联合嵌入,学习交互强度
ELBO 优化
Section titled “ELBO 优化”标准变分推断框架,无需信念级别的监督信号。
在真实野火疏散数据上,行动预测和单信念预测都显著优于基线。
消融实验的关键发现:
- ELBO 决定有哪些信念
- Pairwise 学习信念如何交互
- 时序捕捉信念如何演化
把 LLM 的语义理解能力嫁接到结构化概率图模型上,通过 ELBO 联合学习动态信念图的演化和行动预测,无需任何信念级别的监督信号——这是 ToM 推理从”提示工程”走向”可学习认知模型”的有意义一步。
这个 Neuro-symbolic 范式值得推广到更多需要可解释性的领域。
参考论文:Learning Dynamic Belief Graphs for Theory-of-mind Reasoning (arXiv:2603.20170)