AI Agent 开发入门:从 6 个顶级开源项目学架构与选型
如果你想从“完整项目”入手做 AI Agent 开发优先看这几个开源项目按类型帮你分了类为什么从这里开始因为 Agent 开发涉及记忆、工具、规划、多模型、多平台等多个复杂模块自己从零搭建容易陷入细节。直接研究成熟项目能快速掌握最佳实践和架构模式事半功倍。单体“自进化 Agent”框架Hermes Agent爱马仕—— 重点看记忆系统 技能自学习闭环 多平台网关GenericAgent—— 重点看极简 ~3K 行自进化架构适合自己照着重构多平台“助手型 Agent”OpenClaw龙虾—— 重点看多平台消息网关 工具集成 可观测性多角色“多 Agent 协作”框架MetaGPT—— 重点看角色化多 Agent 软件公司流程编排CrewAI—— 重点看轻量多 Agent 任务拆分 工作流编排平台级 Agent 工作流Dify—— 重点看可视化 Agent 工作流 RAG 一键部署下面按“你要开发”的视角简单说说每个项目适合学什么、怎么选。1. Hermes Agent爱马仕—— 自进化单体 Agent仓库NousResearch/hermes-agent官网https://hermes-agent.org特点自我进化闭环任务完成后自动提炼成 Skill下次直接复用并持续优化 Skill四层持久记忆热记忆/温记忆/冷记忆 USER.md / MEMORY.mdSQLite FTS5 全文检索多平台消息网关Telegram / Discord / Slack / 飞书 / 钉钉 / WhatsApp 等 10 平台6 种执行后端本地、Docker、SSH、Daytona、Singularity、Modal 等多模型OpenRouter 200 模型、OpenAI、Kimi、MiniMax 等开发上值得学的点如何设计“执行 → 总结 → Skill 生成 → Skill 自改进”的闭环这是 Hermes 最大的亮点分层记忆系统怎么存、怎么检索、怎么自动摘要和遗忘消息网关层如何与核心 Agent 引擎解耦前端只负责收发消息真正的 Agent 循环在一个地方跑Skill 标准化YAML/Markdown 元数据 文档和技能市场/生态怎么做适合你想做一个“长期在线、越用越懂你”的个人 Agent / 办公助手尤其看重记忆和自进化能力。2. GenericAgent —— 极简自进化框架适合自己重写仓库lsdefine/GenericAgent特点核心只有约 3K 行代码Agent 循环约 100 行9 个原子工具自进化每次任务自动沉淀成 Skill形成个人技能树系统级控制浏览器、终端、文件系统、键盘鼠标、屏幕视觉、ADB手机等兼容多种模型Claude / Gemini / Kimi / MiniMax 等开发上值得学的点如何用最少的代码实现一个完整的 Agent Loop观察 → 思考 → 行动 → 记忆 → Skill如何把“工具层”抽象成 9 个原子工具再组合出复杂技能自进化的实现细节Skill 的数据结构、触发条件、版本演进机制适合你如果你想“自己从零写一个 Agent 框架”GenericAgent 比 Hermes 更适合当骨架因为它刻意做得极简代码量小容易通读再重写。3. OpenClaw龙虾—— 多平台助手型 Agent仓库openclaw/openclaw官网https://openclaw.ai特点定位个人 AI 助手跑在你自己的设备上通过 WhatsApp / Telegram / 邮件等渠道帮你做事Gateway-first 架构强调多平台消息接入 可控执行内置大量工具邮件、日历、浏览器、文件操作等偏“生活/办公自动化”多模型支持可以一键切换不同模型开发上值得学的点消息网关设计如何统一接 WhatsApp / Telegram / 邮件 / Slack再转成统一消息格式给 Agent 核心工具抽象如何把“发邮件”“查日历”“操作浏览器”等统一抽象成 Tool可观测性与安全日志、权限、审批、沙箱OpenClaw 这块比 Hermes 稍弱但可以看它做了哪些适合你如果你想做“一个连微信/飞书/钉钉的私人助手”OpenClaw 是很好的参考特别是“多端接入”的部分。4. MetaGPT —— 多角色协作的多 Agent 框架仓库FoundationAgents/MetaGPT文档含中文MetaGPT/docs/README_CN.md特点把多 Agent 模拟成“软件公司”产品经理 / 架构师 / 项目经理 / 工程师等角色定义了清晰的工作流需求 → 设计 → 任务拆分 → 编码 → 测试完整流程支持多模型轮转、文档解析、复杂项目自动生成开发上值得学的点如何给每个 Agent 分配“角色 职责 上下文”多 Agent 之间如何通过消息/共享文档协作而不是简单串联如何把“项目流程”固化为可执行的 Pipeline而不是一次性脚本适合你如果你想做“多 Agent 协作完成一个复杂项目比如自动开发一个项目、自动做数据分析报表”MetaGPT 是目前最完整的一个参考。5. CrewAI —— 轻量多 Agent 编排框架仓库crewAIInc/crewAI示例crewAIInc/crewAI-examples特点轻量、独立、高性能的多 Agent 框架强调简单可控通过角色定义 任务拆分 工作流编排把多个 Agent 组装成一个“团队”示例丰富营销自动化、内容创作、业务流程等开发上值得学的点如何定义一个 Agent角色、目标、工具和任务Task如何把多个 Task 组装成流程串行 / 并行 / 条件分支如何在保持轻量的前提下做到可观测和可调试适合你如果你觉得 MetaGPT 太“重”只想做一个小而美的多 Agent 工作流CrewAI 是更轻量的选择。6. Dify —— 平台级 Agent 工作流仓库langgenius/dify官网https://dify.ai特点生产级 LLM 应用开发平台包含 Agentic 工作流、RAG、模型管理、插件等可视化编排工作流拖拽式搭建 Agent 流程插件体系官方插件 社区插件开发上值得学的点如何设计一个“平台级”的 Agent 编排系统工作流节点、变量、错误处理、重试机制RAG / 工具调用 / 多模型如何统一抽象成节点如何做可观测性日志、指标、追踪和权限隔离适合你如果你想做一个“类似 Dify 的 Agent 平台”或者要给团队提供低代码的 Agent 构建能力这个项目值得重点研究。7. 怎么选给你一个简单决策图单 Agent多 Agent记忆 自进化多平台助手偏角色协作偏工作流编排你想做什么 Agent?单 Agent 还是 多 Agent?重点是什么?偏流程还是偏角色?Hermes Agent GenericAgent 做简化版OpenClaw Hermes 记忆设计MetaGPT CrewAI 做轻量版Dify CrewAI 流程抽象结合你说的“爱马仕 / OpenClaw 这种级别”我建议的组合是核心架构参考记忆 自进化看 Hermes GenericAgent多平台接入看 OpenClaw 的网关层多 Agent / 工作流想做“软件公司式”多角色协作看 MetaGPT想做轻量工作流看 CrewAI平台化想做 SaaS / 低代码平台看 Dify8. 实际开发时怎么“抄作业”更高效先定一个很小的目标比如“做一个能自动整理 GitHub Issue 并发飞书通知的单 Agent”先跑通再补记忆和多 Agent。通读一个项目的核心循环Hermes看agent/下的prompt_builder.py/memory_manager.py/skill_utils.pyrun_agent.pyGenericAgent看agent_loop.pyllmcore.pymemory/先删后改把这些项目克隆下来先删掉你暂时不需要的功能比如只保留 CLI 文件工具 简单记忆跑起来再一点点加。统一接口标准工具统一成tool_schemaname / description / parameters / execute消息统一成Messagerole / content / metadata记忆统一成MemoryStoresave / search / delete这样你之后换框架、加平台成本会低很多。9. 下一步从“看懂”到“动手”理论看完了下一步就是动手。这里提供一个简单的学习路径图帮你把知识串联起来学习起点确定你的目标 Agent 类型个人助手型多角色协作型平台/工作流型主攻: OpenClaw Hermes核心模块: 消息网关 记忆系统动手: 实现一个 CLI 助手主攻: MetaGPT CrewAI核心模块: 角色定义 任务编排动手: 实现一个多 Agent 写作助手主攻: Dify CrewAI核心模块: 可视化节点 工作流引擎动手: 设计一个简单的拖拽式流程迭代优化: 加入工具/模型/记忆产出: 你的第一个可运行 Agent记住最好的学习方式是“模仿-修改-创造”。选一个最接近你目标的项目把它跑起来然后尝试修改其中一个模块比如给 Hermes 加个新工具或者给 CrewAI 改个任务流程你会对 Agent 架构有更深的理解。欢迎关注我与我一起学习AI开发。