ReAct 框架详解：AI Agent 推理与行动的黄金范式

发布时间：2026-03-29 18:03:46

23 阅读

0 评论

ReAct（Reasoning + Acting）是目前最经典、最广泛使用的 AI Agent 框架。它由 Yao 等人在 2022 年提出，将推理（Reasoning）和行动（Acting）交织在一起，让 Agent 在每一步都先思考再行动，从而实现更可靠的复杂任务处理。

ReAct 的工作循环

ReAct Agent 遵循一个简单的循环：Thought（思考）→ Action（行动）→ Observation（观察）。在每个 Thought 阶段，Agent 分析当前状态，决定下一步该做什么。在 Action 阶段，Agent 调用一个工具或执行一个操作。在 Observation 阶段，Agent 接收操作的结果，为下一次思考提供依据。循环持续进行，直到 Agent 得出最终答案。

为什么 ReAct 有效？

传统的纯推理方式容易产生幻觉——LLM 可能自信地给出错误答案。传统的纯行动方式缺乏规划——Agent 可能盲目执行工具调用。ReAct 将两者结合：推理让行动更有目的性，行动让推理有事实依据。这种交替模式显著提高了 Agent 在复杂任务上的表现。

ReAct 的 Prompt 模板

ReAct 通常通过精心设计的 Prompt 实现系统指令部分定义可用工具和输出格式。Few-shot 示例展示推理-行动-观察的标准流程。Agent 按照模板格式化每次输出，保持结构化的一致性。

ReAct 的局限与改进

循环陷阱：Agent 可能在某个子问题上反复循环。通过设置最大迭代次数和超时机制来缓解
上下文窗口限制：长链条消耗大量 token。使用摘要压缩历史记录
工具选择错误：Agent 可能调用不合适的工具。优化工具描述和添加工具使用指南
推理深度不足：简单任务上过度思考浪费 token。添加快速路径判断

ReAct 的演进

从基础的 ReAct 模式出发，业界发展出了多种改进：Plan-and-Execute（先规划再执行）、Reflexion（自我反思和改进）、Tree of Thought（多路径探索推理）等。这些方法在不同场景下各有优势。

总结

ReAct 是理解 AI Agent 设计的起点。它简洁而强大，为几乎所有现代 Agent 框架提供了设计灵感。理解 ReAct 是掌握 Agent 开发的必经之路。