Function Calling 与 Tool Use：AI Agent 的双手

发布时间：2026-03-29 18:03:27

50 阅读

0 评论

如果大语言模型是 AI Agent 的「大脑」，那么 Function Calling（函数调用）和 Tool Use（工具使用）就是它的「双手」。正是有了这些能力，Agent 才能从纯粹的文本对话跨越到与真实世界交互。

什么是 Function Calling？

Function Calling 是 LLM 提供商（OpenAI、Anthropic、Google 等）推出的一种标准接口。开发者定义一系列可用的函数（及其参数描述），LLM 在对话过程中判断何时需要调用哪个函数，并生成结构化的调用请求。应用层负责实际执行函数并将结果返回给 LLM。

整个过程是一个循环：用户提问 → LLM 判断需要调用工具 → 返回函数调用请求 → 应用执行函数 → 结果返回给 LLM → LLM 基于结果生成最终回答。LLM 本身不执行任何代码，它只是决策者。

在 OpenAI API 中，开发者通过 tools 参数定义函数列表，包含函数名、描述和参数的 JSON Schema。当 LLM 决定调用函数时，返回 tool_calls 数组，包含函数名和参数值。开发者执行后通过 tool 消息类型将结果回传。

成熟的 Agent 框架通常提供丰富的工具生态。MCP（Model Context Protocol）是新兴的标准化工具协议，定义了 LLM 与外部工具之间的统一接口。未来工具生态将更加开放和标准化。

工具赋予了 Agent 真实的执行能力，因此安全至关重要。需要实施权限控制、输入验证、沙箱执行、操作审计和人工审批（Human-in-the-loop）机制。

Function Calling 是 AI Agent 连接真实世界的桥梁。随着工具生态的完善和标准化（如 MCP），Agent 的能力边界将不断扩展，最终实现真正的自动化。