# 003 大语言模型（LLM）作为 Agent 的“大脑”：GPT、Claude、Gemini 对比

张

张建站

2026/5/3 3:48:31

10分钟阅读

# 003 大语言模型（LLM）作为 Agent 的“大脑”：GPT、Claude、Gemini 对比

从一次诡异的 Agent 死循环说起上周调一个多步骤工具调用 Agent，GPT-4o 在第三步突然开始反复调用同一个天气查询 API，参数一模一样，连续调了 17 次才超时退出。日志里 token 消耗直接炸了，账单多出 3 美元。我盯着那串重复的get_weather(lat=39.9, lon=116.4)看了十分钟，最后发现是 prompt 里少写了一句“如果已经获取过该数据，直接使用缓存结果”。这个坑让我意识到：LLM 作为 Agent 大脑时，模型本身的“性格”差异会被放大到离谱的程度。今天不聊理论，直接拿 GPT-4o、Claude 3.5 Sonnet、Gemini 1.5 Pro 三个模型，在同一个 Agent 框架下跑同样的任务，把它们的“脑回路”扒开看看。工具调用：谁更像个“靠谱的实习生”Agent 最核心的能力是调用外部工具。我设计了一个测试：给三个模型同样的函数定义（查询数据库、发送邮件、计算器），然后说“帮我查一下昨天销售额，如果超过 10000 就发邮件通知团队”。GPT-4o的表现最像人类直觉：先调query_sales("yesterday")，拿到结果 12800，然后调send_email("team@company.com", "昨日销售额 12800，达标")。干净利落，参数格式完全匹配 JSON Schema。但有个隐藏问题——它偶尔会在工具调用之间插入一段自言自语式的推理，比如“嗯，让我先查一下数据……好的，数据拿到了，现在发邮件”。这段推理会消耗 token，而且如果 prompt 里没限制，它可能把推理内容也塞进工具参数里。Claude 3.5 Sonnet的调用风格更“谨慎”。它会在第一次调用前先问一句：“我需要先查询数据库，确认数据后再决定是否发邮件。”然后才执行。这种“先思考再行动”的模式在复杂任务里其实是优点，但如果你追求低延迟

ClawLodge：OpenClaw智能体配置共享中心，加速AI Agent开发与部署

1. 项目概述：ClawLodge，一个为OpenClaw而生的配置共享中心如果你正在使用OpenClaw，或者对构建基于大语言模型的智能体（AI Agent）感兴趣，那你大概率遇到过这样的困境：面对一个功能强大但配置自由…...

2026/5/3 3:31:54 阅读更多 →

歌词滚动姬：免费高效的跨平台歌词制作终极指南

歌词滚动姬：免费高效的跨平台歌词制作终极指南【免费下载链接】lrc-maker 歌词滚动姬｜可能是你所能见到的最好用的歌词制作工具项目地址: https://gitcode.com/gh_mirrors/lr/lrc-maker 歌词滚动姬（LRC Maker）是一款专为…...

2026/5/3 3:29:24 阅读更多 →

LongCat-Video：3D稀疏注意力机制实现高效长视频生成

1. 项目背景与核心价值最近在视频生成领域出现了一个名为LongCat-Video的新模型，它采用3D块稀疏注意力机制实现了高效长视频生成。这个技术特别适合需要批量生成高质量视频内容的场景，比如短视频平台的内容生产、电商产品展示视频自动化制作等。传统视频…...

2026/5/3 3:29:23 阅读更多 →

UVa 173 Network Wars

题目分析本题设定在 212621262126 年，彗星 Swift‑Tuttle\texttt{Swift‑Tuttle}Swift‑Tuttle 撞击地球后，网络中的部分链接被切断，同时一些 AI\texttt{AI}AI 程序发生了变异。两个程序 Paskill\texttt{Paskill}Paskill 和 Lisper\texttt{…...

2026/5/3 0:01:29 阅读更多 →

MA-EgoQA：多智能体第一视角视频问答基准解析

1. 项目背景与核心价值在计算机视觉与自然语言处理的交叉领域，视频问答（VideoQA）一直是极具挑战性的研究方向。而当我们把视角聚焦在第一人称视频（Egocentric Video）时，问题会变得更加复杂——这类视频通常…...

2026/5/3 0:01:47 阅读更多 →

别再死记硬背DDR4时序参数了！用Python脚本自动解析JESD79-4标准文档，生成你的专属配置表

用Python解放DDR4开发：从JESD79-4标准文档自动生成配置工具当第一次打开JESD79-4标准文档时，大多数硬件工程师都会感到一阵眩晕——数百页的技术规范、错综复杂的时序参数、晦涩难懂的寄存器配置，这些内容不仅难以记忆，更在具体项…...

2026/5/3 0:01:58 阅读更多 →

Adobe扩展安装难题如何解决？ZXPInstaller让.zxp文件安装变得智能高效

Adobe扩展安装难题如何解决？ZXPInstaller让.zxp文件安装变得智能高效【免费下载链接】ZXPInstaller Open Source ZXP Installer for Adobe Extensions 项目地址: https://gitcode.com/gh_mirrors/zx/ZXPInstaller 还在为Adobe扩展安装而头疼吗？A…...

2026/5/3 0:11:18 阅读更多 →