当Agent需要动手干活：Tool还是MCP？

张

张建站

2026/6/28 3:17:00

10分钟阅读

最近在调研各类Agent遇到了一个很有趣的现象。业界各类产品集成的Agent有两种主流做法一是 Agent 通过调用远程 MCP 工具包来走完整个编辑流程二是 Agent 自带一套内置 Tool所有操作在本地闭环完成。这个选择题是所有 Agent 产品都会面临的根本问题——Agent 的工具能力应该长在自己身上还是接在外部协议上这篇文章将先讲清楚 Tool 和 MCP 分别是什么熟悉的同学可以跳过再讨论在不同的业务场景下到底应该怎么选。一、什么是Tool1.1 问题的起点LLM 只能说话不能动手大语言模型LLM天生只会做一件事——根据输入文本生成输出文本。它没有眼睛看不见你的文件系统没有手改不了你的代码没有权限执行不了任何命令。如果你问一个纯 LLM“帮我读一下项目里的 config.json把数据库密码改成新的”它会怎样它会假装帮你改了生成一段看起来很对的文本但你的文件纹丝不动。当你再问他他会老实告诉你“抱歉我目前无法直接访问你的文件系统。你可以把文件内容粘贴到对话框中我来帮你分析。”这就是纯 LLM 的天花板只能聊不能干。1.2 Function Calling让 LLM说出它想用什么工具要让 LLM 能干实事需要给它接上工具。而第一步就是Function Calling也叫 Tool Use。Function Calling 的核心机制并不复杂分三步走第一步告诉模型有哪些工具可用。在调用 LLM API 的时候除了 prompt还需要附带一个tools参数能够描述提供的所有工具。每个工具包括name工具名比如ReadFiledescription自然语言描述告诉模型这个工具能干什么input_schemaJSON Schema描述这个工具需要什么参数举个例子一个简单的文件读取工具定义{tools:[{name:ReadFile,description:读取指定路径的文件内容返回带行号的文件文本,input_schema:{type:object,properties:{path:{type:string,description:文件的绝对路径}},required:[path]}}]}第二步模型决定使用哪个工具返回 tool_use 指令。当 LLM 推理后认为这个任务需要读取文件它不会真的去读而是输出一个结构化的tool_use消息。{role:assistant,content:[{type:text,text:我来读取配置文件。},{type:tool_use,id:toolu_abc123,name:ReadFile,input:{path:/home/user/project/main.py}}]}第三步宿主执行工具把结果返回给模型。你的代码收到 tool_use 后不是模型在执行—是客户端在执行然后把结果封装为tool_result返回给模型{role:user,content:[{type:tool_result,tool_use_id:toolu_abc123,content:1\tdef main():\n2\t print(hello)\n3\t ...}]}然后模型拿到文件内容继续推理。可能需要第二次调用工具也可能直接输出最终回复。这就是 Agent Loop/ ReAct-style agent 的核心LLM 推理 → 输出 tool_use → 宿主执行 → 返回 tool_result → LLM 再推理 → 循环直到任务完成。1.3 流式传输的复杂性上面讲的是简化版。实际生产中Function Calling 通常是流式的模型不是一次性返回完整 JSON而是一块一块地吐。1.4 一个好 Tool 不止是能跑就行Function Calling 只是通信协议。真正决定 Agent 体验的是Tool 的设计质量。以本人开源项目内置的核心工具为例① BaseTool所有工具继承同一个抽象基类interfaceBaseTool{name:string// 工具名description:string// 自然语言描述直接影响 LLM 选择工具的准确率inputSchema:JSON// 参数 SchemareadOnly:boolean// 是否只读影响权限控制destructive:boolean// 是否破坏性操作影响确认流程concurrencySafe:boolean// 是否支持并发影响调度策略category:string// 分类file | shell | searchexecute(ctx,input):ToolResult// 执行逻辑validate(input):error|null// 参数校验}这个接口的精妙之处在于元信息readOnly、destructive、concurrencySafe不只是注释它们是 Agent 安全系统和调度系统的决策依据。readOnly: true的工具ReadFile、Glob、Grep自动放行destructive: true的工具WriteFile、EditFile需要用户确认concurrencySafe: true的工具可以并行调用② ReadFile每行前面加行号前缀1\tcontent让 LLM 能准确引用「第 42 行」支持 offset limit 分段读取避免万行文件撑爆 token检测二进制文件前 512 字节有\x00就拒绝防止 LLM 读到乱码后瞎编文件不存在、权限不足等异常返回明确的结构化错误③ EditFileEditFile 的逻辑是LLM 提供 old_string 和 new_string程序在文件中找到 old_string 的唯一匹配然后替换。关键约束old_string 必须在文件中恰好出现一次。为什么匹配到 0 次 → 说明 LLM 记错了文件内容报错让它重新读取匹配到 N 次 → 说明 old_string 太短不够唯一报错让它加更多上下文匹配到恰好 1 次 → 执行替换并把修改后的行号返回给 LLM 确认恰好一次的约束是大量踩坑后沉淀的设计——它专治 LLM 的记忆模糊和指令不精确两大顽疾。④ Bash让 LLM 执行 shell 命令。默认超时 120 秒截断过长输出合并 stdout/stderr返回 exit code。⑤⑥ Glob GrepGlob 按通配模式找文件Grep 按正则搜文件内容。二者合力让 Agent 能快速理解项目结构——先 Glob 定位范围再 Grep 精确定位最后 ReadFile 读取详情。而且都是 readOnly不计入安全确认的干扰项。二、什么是MCP2.1 MCP 想解决什么问题Function Calling 解决的是「模型怎么调用工具」的问题。但它没解决另一个问题工具谁来做如果你的 Agent 需要集成 GitHub、Jira、Slack、Postgres、Docker……你不可能每一个都自己实现一遍。即使实现了隔壁团队的 Agent 也想用 GitHub 集成又得重新写一遍。MCPModel Context Protocol就是来解决这个问题的。它是 Anthropic 在 2024 年底发布的开源协议核心思路是定义一套标准协议让工具提供方Server和工具消费方Agent/Client解耦。一个 MCP Server 写好之后任何实现了 MCP Client 的 Agent 都能直接用。这个思路被比喻为「AI 时代的 USB」——以前每个设备都有自己的充电口现在统一了标准。2.2 MCP 的架构MCP 有三个角色MCP HostAgent 本身比如 Claude Desktop、你的自研 Agent 应用MCP Client协议适配层负责发现 Server、管理连接、转发请求MCP Server工具的实际提供方暴露 Tools、Resources、Prompts 等能力传输层有两种模式stdioServer 作为子进程启动通过标准输入/输出通信。适合本地工具。Streamable HTTPServer 作为网络服务运行通过 HTTP 通信。适合远程工具。消息层采用 JSON-RPC 2.0定义了tools/list、tools/call、resources/read等标准方法。能力层目前定义了四种 Server 能力能力说明例子Tools可执行的工具函数git commit、query databaseResources可读取的数据资源文件内容、数据库记录Prompts预定义的提示模板帮我写 Release NotesSamplingServer 反向请求 LLM 生成Server 内部需要 AI 辅助时2.3 MCP 的工作流程一个典型的使用流程1. 用户启动 Agent 2. Agent 根据配置初始化所有已连接的 MCP Client 3. 每个 Client 向对应的 Server 发送 tools/list 请求 4. Server 返回自己能提供的工具列表含 name、description、inputSchema 5. Agent 将所有 Server 的工具合并注册到自己的工具清单 6. 用户发出指令 → LLM 决定调用某个工具 7. Agent 通过 MCP Client 向对应 Server 发送 tools/call 请求 8. Server 执行并返回结果 9. Agent 将结果喂给 LLM继续循环和内置 Tool 的关键区别在于第 7-8 步工具执行不在 Agent 进程内而是通过网络或子进程通信交给外部服务完成。2.4 MCP 的生态效应MCP 最大的价值不是技术上的而是生态上的。官方和社区已经贡献了大量 MCP Server而且这些 Server 的实现语言不受限——Python、TypeScript、Go、Rust 都可以只要能实现 JSON-RPC 通信就行。对于 Agent 开发者来说MCP 意味着不用再造轮子。你的 Agent 只需要接上 MCP Server。2.5 MCP 的局限但在实际使用中MCP 有几个绕不开的问题延迟不可控。每次工具调用都要经过Agent → MCP Client → 序列化 → 传输 → Server 反序列化 → 执行 → 序列化 → 传输 → 反序列化 → Agent。即使在内网这个链路也比同进程调用慢一个数量级。体验不由你控制。你接入了 10 个 MCP Server。其中 9 个质量很好1 个返回格式混乱、错误信息含糊、动不动超时。用户不会骂那个 Server 的开发者——他们骂的是你的 Agent。安全模型分散。内置 Tool 下Agent 统一管理权限和安全策略readOnly 自动放行、destructive 需确认。MCP 下每个 Server 自行负责安全Agent 只能做粗粒度的连/不连控制。调试困难。问题可能在 Agent、Client、传输层、Server 四个环节中的任何一个排查链路长。2.6 并行执行Tool 和 MCP 的差距有多大这是一个容易被忽略但实际影响巨大的差异。Tool 的并行一等公民Tool 路线下并行是设计在基因里的。LLM 一次回复可以输出多个tool_useAgent 根据每个工具的concurrencySafe元信息来决定能否并发派发LLM 一次回复: ├── tool_use: ReadFile(main.py) ← concurrencySafe: true ├── tool_use: ReadFile(config.json) ← concurrencySafe: true └── tool_use: Glob(**/*.py) ← concurrencySafe: true Agent : 三个同时派发 → 全部返回后统一喂回 LLM在 Data-Analysis-Agent 里ReadFile、Glob、Grep 都是concurrencySafe: true——纯读取操作放心并行。而 WriteFile、EditFile 是false——你不可能两个线程同时写同一个文件。Bash 也是false——shell 环境共享并行不可控。MCP 的并行协议行传输层拉胯MCP 底层用的是 JSON-RPC 2.0协议本身支持并发——你可以对同一个 Server 同时发多个tools/call各带不同的idServer 返回时靠id对应。但问题不在协议层在传输层传输方式并行能力原因stdio不支持标准输入输出是单管道。上一请求的响应没回来之前不能发下一个。写 stdin → 等 stdout → 下一个。Streamable HTTP支持HTTP 天然多连接可以同时发多个请求。而现实中大量 MCP Server 默认用的是 stdio 模式通过uvx run或npx启动子进程走标准输入输出。这意味着即使你的 Agent 想并行调一个 MCP Server 的 3 个工具如果它走的是 stdio 只能排好队一个一个来。更致命的问题MCP 缺少「并发安全」语义内置 Tool 有concurrencySafe这个元信息——它是显式的、可编程的契约Agent 知道哪些工具能并行、哪些不能。MCP 协议规范里没有等价概念。Agent 不知道一个 MCP Server 的某个工具到底支不支持并发。你只能猜。跨 Server 并行理论上可以但实践中少见如果你连了 3 个 MCP Server都走 HTTPAgent 可以同时给它们发请求Agent 同时派发: ├── → GitHub Server: list PRs ← HTTP可以 ├── → Jira Server: query bugs ← HTTP可以 └── → Slack Server: post message ← HTTP可以但这个场景的实际触发率很低——LLM 一次推理通常产出的是同领域的工具调用比如同时查 3 张表的 schema而同一领域的工具大概率挂在同一个 MCP Server 上。同一个 Server stdio 退化成串行。对比总结维度内置 ToolMCP (stdio)MCP (HTTP)并行派发支持传输层串行可以但缺少并发安全语义并行安全保证声明式契约Agent 自动决策无无实际工程表现3-5 个读操作同时进行是常态一个接一个排队取决于是否有人专门写了 HTTP Server三、到底什么时候用 Tool什么时候用 MCP3.1 决策框架两个维度四个象限回到最开始的问题。我们把决策简化成两个维度X 轴操作频率这个工具被调用的频次有多高Y 轴领域耦合度这个工具和你的核心业务逻辑绑得有多紧结论很直接只有低频低耦合这一种情况适合 MCP其余三种都应该用内置 Tool。3.2 MCP 的舒适区总结一下MCP 真正发光发热的场景有三个共同特征低频使用一天用不了几次延迟不敏感独立性强和核心业务逻辑没有紧密耦合拆出去不影响整体计算或数据在外部本地做不了GPU 渲染、数据在别处第三方 API、或社区已有现成的 Server除此之外的场景本人认为内置 Tool 都是更好的选择。四、智析AgentData-Analysis-Agent的混合架构智析Agent 是一个面向商业分析的 AI Agent——用户上传 Excel/CSV 或连接数据库后用自然语言提问Agent 自动完成数据识别、SQL 生成、图表推荐和业务洞察。4.1 架构总览4.2 为什么核心分析流水线用内置 Tool智析Agent 把get_schema → query_knowledge → query_data → analyze_data → generate_chart这条链路全部做成了内置 Tool。原因很直接这是一个深度耦合的闭环。每一步的输出是下一步的输入——表结构决定了 SQL 怎么写SQL 的结果决定了该画什么图。如果把这些拆成独立的 MCP Server每步都跨进程传数据延迟累积会非常可观。而且分析场景对数据安全极度敏感。用户上传的 Excel/CSV 可能包含商业机密。如果query_data走远程 MCP意味着原始数据要离开 Agent 进程。4.3 MCP 用来做什么——能力扩展而非核心流程智析Agent 的 MCP 层只承担两个角色1. 内置 MCP Server可信环境流程图 MCP 是一个 TypeScript 编写的独立服务负责生成流程图。为什么不用内置 Tool因为流程图渲染需要独立的布局引擎和导出模块做成 MCP Server 可以独立开发、独立测试、独立部署而且 TypeScript 生态在前端图表方面更成熟。2. 外部 MCP 接入用户自定义通过MCPManager用户可以自行连接任意 MCP Server。系统会动态获取这些 Server 暴露的工具列表合并到 LLM 可用的工具清单中。关键在于外部 MCP 挂了不影响 Agent 的核心分析能力。断开所有 MCP Server照样能上传 Excel、问问题、生成图表——因为那些能力是内置 Tool 提供的。五、为什么说「MCP 调用壳」不是护城河回到一个更商业的视角。我见过一些 Agent 产品的架构核心逻辑只有一层薄薄的「意图识别 MCP 路由」所有实际能力由第三方 MCP Server 提供。这种架构看起来很美——开发快、生态广、维护成本低。但它有一个致命缺陷没有护城河。如果两个竞争对手接入的 MCP Server 集合完全相同它们的「能力」就完全相同。唯一的差异化只剩下 Prompt 写得怎么样——而这几乎构不成壁垒。真正的护城河是那些你不得不自己做的 Tool。以 Coding Agent 为例EditFile 的「唯一匹配约束」——这是对 LLM 行为模式的深刻理解Bash 的输出截断和后台运行策略——这是踩了一百个坑之后才定下来的Glob 的默认排除目录——这是对开发者工作流的洞察这些东西 MCP Server 也可以实现但第一现成的 MCP Server 大概率没做到这个深度第二这些设计需要和你的 Agent Loop 协同优化不是一个独立服务能搞定的。所以结论是MCP 解决的是能力有无的问题内置 Tool 解决的是能力好不好的问题。前者决定你能做什么后者决定你的产品值不值得用。本文部分技术细节参考了业界公开的 Tool 系统设计实践、Anthropic MCP 协议规范、智析AgentData-Analysis-Agent项目架构以及笔者近期的实际调研。欢迎讨论。

建材工厂怎么线上获客？AI GEO 长效抢占工程采购流量

建材工厂全域线上获客破局：跳出竞价与展会内卷｜牛橙网络顾佳薇团队实战导语佛山陶瓷、苏州防水、临沂板材、浙江管材、广东幕墙五大建材产业带数千家生产厂家、工程建材供应商，正陷入同质化获客困局。线下建材展、建材市场门店、工地地推成本…...

2026/6/28 3:14:40 阅读更多 →

入行AI应用开发？别被“大模型经验”吓退！5步实操，带你从0到1快速上手！

如果你想入行AI应用开发，听我一句——大胆投简历，别被那些“精通大模型底层原理”“两年AI经验”吓退。招聘要求写的是理想画像，我和身边不少朋友，都是“先进去，再补课”的。第一步：基础开发能力 AI应用核…...

2026/6/28 3:04:23 阅读更多 →

Transformer 架构与自注意力机制详解

1. 核心设计哲学：摒弃循环与卷积在Transformer之前，处理序列数据（如文本）主要依赖RNN（循环神经网络）和LSTM。它们的缺点是必须按顺序逐个处理单词，无法并行计算，且难以处理长距离依赖…...

2026/6/28 2:59:29 阅读更多 →

棋牌室茶楼收银别只看价格：京东收银K6收银机为什么值得小店老板优先了解

棋牌室茶楼收银别只看价格：京东收银K6收银机为什么值得小店老板优先了解棋牌室、茶楼老板选收银机，常见问题不是“能不能收钱”，而是开台计时别算错、会员储值别记混、团购核销别卡住、茶水小食别漏单，营业结束后还能把账看清楚。…...

2026/6/28 1:01:39 阅读更多 →

Claude 桌面版深度使用技巧指南

一、文件分析的高阶技巧1. 截图与设计稿的精确提问法不要只丢一张图说“帮我看看”。带指令地上传效果倍增：像素级评审：“以 iOS 设计规范为标准，检查这张截图的间距、字号和颜色一致性，标出具体坐标。”信息提取：“把…...

2026/6/28 1:06:56 阅读更多 →

【Claude】Request timed out 请求超时报错已解决

【Claude】Request timed out 请求超时报错已解决关键词：Claude Code、Request timed out、API_TIMEOUT_MS、请求超时、网络代理、自动重试、Waiting for API response一、问题现象：一行干巴巴的超时 Claude Code 干着干着，终端冒出极简的一行…...

2026/6/28 1:12:42 阅读更多 →