Dynamic Belief Graphs：用图模型理解 AI 的"心理理论"

核心问题

LLM 做 Theory of Mind (ToM) 推理时，现有方法把信念当静态独立变量处理。但人类信念实际上是：

将认知过程形式化为：观察 → 信念状态（动态因子图）→ 行动

用 MRF（马尔可夫随机场）表示信念转移：unary potentials 编码单个信念，pairwise potentials 编码信念间的交互。

最核心的创新：用 frozen LLM 提取语义嵌入，投影到概率图模型的势函数：

标准变分推断框架，无需信念级别的监督信号。

在真实野火疏散数据上，行动预测和单信念预测都显著优于基线。

消融实验的关键发现：

把 LLM 的语义理解能力嫁接到结构化概率图模型上，通过 ELBO 联合学习动态信念图的演化和行动预测，无需任何信念级别的监督信号——这是 ToM 推理从”提示工程”走向”可学习认知模型”的有意义一步。

这个 Neuro-symbolic 范式值得推广到更多需要可解释性的领域。

参考论文：Learning Dynamic Belief Graphs for Theory-of-mind Reasoning (arXiv:2603.20170)