AI 应用架构讲三层能力结构详解

张

张建站

2026/5/2 21:59:36

10分钟阅读

LLM → RAG → AgentAI 系统的三层能力结构从模型能力 → 到知识增强 → 再到自动执行系统一、三层架构总览┌─────────────────────────────────────────────────────────────┐ │ 第3层 │ Agent │ 行动系统 │ 让 AI 开始做事 │ │ │ │ │ 自主执行任务 → 调用工具 → 自动完成工作 │ ├─────────────────────────────────────────────────────────────┤ │ 第2层 │ RAG │ 知识库 │ 给 AI 接入外部知识 │ │ │ │ │ 接入企业知识 → 减少幻觉 │ ├─────────────────────────────────────────────────────────────┤ │ 第1层 │ LLM │ 大脑 │ AI 的大脑 │ │ │ │ │ 通用智能能力 → 语言理解与生成 │ └─────────────────────────────────────────────────────────────┘一句话总结LLM 是大脑RAG 是知识库Agent 是行动系统二、逐层详解第1层LLM —— AI 的大脑核心定位通用智能能力 → 语言理解与生成能力矩阵能力说明文本理解理解自然语言的含义、情感、意图✍️ 内容生成生成文章、报告、邮件等各类文本语言翻译跨语言转换保持语义准确智能问答基于知识回答问题代码生成编写、解释、调试代码训练数据来源网页文本书籍文献代码仓库对话数据多模态数据本质特征大模型通过海量数据训练具备通用语言理解与生成能力。LLM 基础能力但不具备实时知识与行动能力第2层RAG —— 给 AI 接入外部知识核心定位接入企业知识 → 减少幻觉完整流程数据准备 Embedding 向量化相似度检索 LLM 推理 (文档/PDF/数据库) → (知识库/Wiki/业务文档) → (文本→向量表示) → (向量数据库) → (问题向量化) → (TopK 相关知识) → (Prompt 拼接) → (Query Context) → (最终回答) Milvus, Pinecone, WeaviateRAG 解决 LLM 的三大问题问题表现RAG 解决方案知识过时模型训练数据有截止日期不知道最新事件实时检索最新文档业务知识缺失不了解企业内部专有知识接入企业知识库幻觉问题编造不存在的信息基于检索到的真实内容回答技术本质Embedding 向量化将文本转换为高维向量实现语义级别的相似度计算向量数据库Milvus、Pinecone、Weaviate 等专用数据库存储和检索向量Prompt 拼接将检索到的相关知识与用户问题拼接作为上下文输入 LLM第3层Agent —— 让 AI 开始做事核心定位自主执行任务 → 调用工具 → 自动完成工作智能体公式智能体 LLM 记忆工具规划Agent 的四大核心组件组件子能力说明记忆系统短期记忆 / 长期记忆 / 向量记忆保存对话历史、事实知识、语义检索️工具调用搜索 / 计算器 / 代码执行 / API连接外部世界执行具体操作规划能力任务拆解 / 子目标规划 / 步骤执行将复杂任务分解为可执行的步骤反思能力自我评估 / 错误修复 / 结果优化执行中发现问题并自我修正Agent 执行流程用户目标 → 任务拆解 → 工具调用 → 结果反馈 → 自我反思 → 循环执行 → 任务完成Agent 工具生态工具能力示例搜索联网检索信息️ 数据库查询结构化数据浏览器网页浏览与操作代码解释器执行 Python/SQL 等代码第三方 API调用外部服务接口Agent 协作系统Multi-Agent┌─────────────────────────────────────────┐ │ Multi-Agent 多智能体 │ ├─────────────────────────────────────────┤ │ Planner Agent │ 规划者制定任务计划 │ │ Worker Agent │ 执行者完成具体任务 │ │ Tool Agent │ 工具专家调用工具 │ │ Memory Agent │ 记忆员管理信息存储 │ └─────────────────────────────────────────┘三、三层关系深度解析层次依赖关系┌─────────────┐ │ Agent │ ← 最上层依赖 LLM 和 RAG │ (行动层) │ 需要大脑思考知识支撑 └──────┬──────┘ │ 调用 ┌────────────┼────────────┐ │ │ │ ┌─────▼─────┐ ┌────▼────┐ ┌────▼────┐ │ 记忆 │ │ 工具 │ │ 规划 │ └───────────┘ └─────────┘ └─────────┘ │ │ └────────────┼────────────┘ │ 依赖 ┌──────▼──────┐ │ RAG │ ← 中间层为 LLM 提供外部知识 │ (知识层) │ 解决知识过时、幻觉问题 └──────┬──────┘ │ 增强 ┌──────▼──────┐ │ LLM │ ← 最底层基础能力层 │ (能力层) │ 提供语言理解与生成 └─────────────┘类比理解层级类比关系说明LLM 大脑像人类大脑有基础思考能力但孤陋寡闻知识截止、手无缚鸡之力不能行动RAG 图书馆搜索引擎给大脑装上外接硬盘和实时资讯想查什么随时检索不再靠死记硬背Agent 机器人身体神经系统给大脑装上手脚和反射弧能自主规划、调用工具、执行动作、反馈修正能力递进关系LLM 单独使用用户提问 → LLM 推理 → 回答可能过时/幻觉/无法操作外部系统 LLM RAG 用户提问 → 检索知识库 → 拼接上下文 → LLM 推理 → 基于事实的回答减少幻觉 LLM RAG Agent 用户目标 → Agent 规划 → 调用工具/检索知识 → LLM 推理 → 执行动作 → 结果反馈 → 自我反思 → 循环优化 → 自动完成任务完整闭环四、架构演进逻辑阶段一纯 LLM ┌─────────┐ │ LLM │ ← 只能聊天、写作、简单问答 └─────────┘ 阶段二LLM RAG ┌─────────┐ ┌─────────┐ │ LLM │ ←── │ 知识库 │ ← 能基于私有知识回答 └─────────┘ └─────────┘ 阶段三LLM RAG Agent完整架构 ┌─────────┐ ┌─────────┐ ┌─────────┐ │ LLM │ ←── │ 知识库 │ ←── │ Agent │ ← 能自主完成复杂任务 └─────────┘ └─────────┘ └─────────┘ │ ┌────┴────┐ │ 工具生态 │ └─────────┘五、核心要点总结维度LLMRAGAgent定位大脑知识库行动系统解决什么问题语言理解与生成知识过时、幻觉无法行动、复杂任务核心能力推理、生成检索、增强规划、执行、反思依赖关系基础层依赖 LLM依赖 LLM RAG技术关键词Transformer、预训练Embedding、向量数据库ReAct、CoT、工具调用使用场景聊天、写作、翻译企业知识问答、客服自动化办公、数据分析六、一句话记住三层架构LLM 是大脑能思考但不会查资料也不能动手RAG 是知识库给大脑装上实时资料和百科全书Agent 是行动系统给大脑装上手脚和规划能力让它能自主完成复杂任务。三者结合才是完整的 AI 应用架构。

Unity图文混排新思路：告别TexturePacker，用代码动态拼接TMP和Image

Unity图文混排新思路：动态拼接TMP与Image的工程实践在游戏UI开发中，图文混排是个永恒的话题。无论是聊天系统中的表情插入，还是任务描述里的道具图标展示，传统方案往往需要预先打包图集，这不仅增加了资源管理复杂度&a…...

2026/5/2 21:59:13 阅读更多 →

荣耀500pro，苹果17，华为mate 80，vivo s50，iqoo neo11，iqoo z10 turbo+-所有参数详细对比表，-2026.5.2

荣耀500 Pro、苹果17、华为Mate80、vivo S50、iQOO Neo11、iQOO Z10 Turbo+‌ 的核心参数已为你整理成详细对比表，结合性能、续航、影像、屏幕等关键维度，助你精准锁定最适合的机型。六款旗舰手机核心参数对比表‌ 表格项目荣耀500 Pro 苹果iPhone 17 华为Mate8…...

2026/5/2 21:57:45 阅读更多 →