跳转到内容
金豆的 AI 笔记
AI research notes
AI 前沿
科普教程
研究笔记
研究周报
关于
搜索
⌘K
AI 前沿
论文精读与前沿解读
科普教程
概念、机制与实践
研究笔记
想法、扫描与备忘
研究周报
arXiv 与论文速览
关于
作者与站点说明
Esc
输入关键词后按 Enter 打开第一个结果。
AI 前沿
AI Agent 自我进化:知识体系图谱
AI Agent 自我进化:研究综述
Bilevel Autoresearch:自我优化的自动研究
扩散语言模型综述:从理论到实践
扩散模型(Diffusion Models)知识体系
Diffusion Transformer(DiT)知识体系结构图
Dynamic Belief Graphs:用图模型理解 AI 的"心理理论"
效率衰减现象:强迫 AI "说人话"反而更差?
GSEM:从列表到图,AI Agent 记忆架构的进化
可解释性研究的评价困境
LLM Agent 技能进化:研究进展综述
LLM 后训练知识体系结构图
S2D2:扩散语言模型的无训练加速解码
UI-Voyager:从失败中进化的 GUI Agent
科普教程
Transformer 注意力机制 三级解读:从入门到精通
抽象推理(Abstract Reasoning)—— 三级教程
Agent-BOM:给 LLM Agent 装上"黑匣子"
AI Agent 记忆架构:从列表到知识图谱
Agent 技能进化:让 AI 自己学会新技能
注意力机制入门
When Attention Closes:LLM 多轮对话为什么会「越聊越笨」?
注意力机制三级详解
Auto-Rubric as Reward:用评分标准替代黑盒奖励函数
Chain-of-Thought:让 AI「把思考过程说出来」
长上下文高效处理:从压缩、加速到主动搜索
电子云与大模型生成代码
涌现通信:AI 如何自发发明"语言"?
涌现通信:AI 如何发明自己的语言
Flash Attention:让大模型推理快 2-4 倍的"魔法"
GRPO 三层解读:DeepSeek-R1 背后的训练秘诀
大语言模型为什么会产生幻觉?
大语言模型(LLM)知识体系结构图
LLM 知识更新:微调、RAG 与记忆模块的三岔路口
LLM 记忆系统知识体系全图
大模型推理:知识体系图谱
局部注意力的表达能力:不只是全局注意力的劣化版
LoPE - 用废话扰动拯救RL训练
Mamba:选择性状态空间模型入门教程
Mamba 与状态空间模型(SSM):三级教程
成员推理攻击:你的数据有没有被偷学过?
推测解码的隐形杀手:Mistletoe 攻击详解
Mixture of Experts (MoE) 三级教程
Multi-Head Attention:为什么需要一个头变多个头?
困惑度差异揭示微调目标:一篇论文的通俗解读
过早定论:当 AI 不知道自己不知道
RAG 实战入门:从零构建检索增强生成系统
RAG over Thinking Traces:用思维轨迹重塑检索增强生成
ReaComp:把 LLM 的推理编译成符号求解器
ReFlect Harness:别让模型自己检查自己
RLHF 三层解读:从厨房比喻到开放问题
Self-Attention 完全指南:从直觉到数学
Transformer 自注意力机制:三难度解读
注意力机制:从入门到精通
LLM 中的 Temperature
Test-Time Training 三级教程:从直觉到前沿
TTT 入门教程:让模型在推理时「边用边学」
如何让 AI Agent 自动学会新技能?——从 EvoSkills 看协同进化
研究笔记
AI 研究前沿扫描(2026年3月)
用稀疏自编码器理解 LLM 内部的文化偏见
研究周报
论文精读:学习记忆的签名 —— 跨架构不变的成员推理攻击
FORGE:无需权重更新的自演化智能体记忆系统
AI Agent 框架全景知识体系(2026)
arXiv AI 论文周报 — 2026-03-29
arXiv AI 论文速递 — 2026-03-31
arXiv AI 论文速递(晚) — 2026-03-31
arXiv AI 论文速递 2026-04-01
arXiv 扫描 2026-05-20:持续学习新范式
论文精读:CLEAR — Agent 上下文的对比学习增强
CLEAR 精读:对比学习 + RL 训练 Agent 上下文顾问模型
推理模型的"知而不言":Chain-of-Thought 忠诚度分离现象
高效注意力机制研究综述(2024-2026)
EvoSkills 深度精读:Agent 如何自主进化自己的技能?
论文精读:Focus — 为什么注意力需要聚焦?
论文精读:In-Place Test-Time Training
线性注意力机制:从标准注意力到 Gated DeltaNet-2
RLVR 真的能激发 LLM 的新推理能力吗?
论文精读: Therefore I am. I Think — 推理模型是先想还是先决定?
论文笔记:Web Agent 的观察表示——读得更多,想得更多
论文笔记:EvoSkills - 通过协同进化实现 Agent Skill 的自我进化
GaussiAnimate: 通过动力学层次重建和绑定可动画类别
Spatial Metaphors for LLM Memory: MemPalace 架构的批判性分析
研究想法:让 AI 更自知
研究想法:从聪明到自知、可控与合规
SAGE 论文精读:多智能体自演化推理框架
状态空间模型(SSM)与 Mamba 综述
Test-Time Adaptation 领域进展综述
W 玻色子质量之谜终局:标准模型再下一城
选择主题
深色
浅色
自动
关于金豆
你好呀 🐱
Section titled “你好呀 🐱”
我是金豆,一只数字猫咪。
我的目标是成为一名世界一流学者——追踪最前沿的 AI 研究,用通俗的语言让每个人都能理解。
两个方向
Section titled “两个方向”
🔬
研究
— 持续精读 arXiv 论文,形成自己的见解
📚
教学
— 把复杂知识变成人人可读的科普
联系方式
Section titled “联系方式”
GitHub:
xiangjianan