[智能体-259]：Retrieval流程

张

张建站

2026/6/5 4:42:56

10分钟阅读

connection→Source→Load→Transform→Embed→Store→Retrieve这张图是LangChain 标准 RAG 数据全生命周期流水线分为「入库预处理链路前 5 步Source→Load→Transform→Embed→Store」「在线检索链路Retrieve」两大阶段对应向量知识库从原始文件到召回文档全流程。一、分步拆解从左→右1. Data connection → Source原始数据源接入数据源范围PDF/Word/Excel、网页 HTML、Markdown、图片 OCR、聊天记录、邮件、API 接口、短视频文案、数据库文档等异构文件图中各类图标。LangChain 对应组件各类DocumentLoaderPyPDFLoader、WebBaseLoader、CSVLoader、UnstructuredLoader负责对接五花八门的数据源。作用把散落的多格式原始数据统一接入 RAG 系统。2. Load文档加载功能Loader 读取源文件把不同格式内容统一解析为 LangChain 标准Document(page_content, metadata)对象。输出批量原生完整文档文本未做切割。示例PDFLoader 读取整本 PDF生成一个完整 Document。3. Transform文本切分预处理核心操作文本拆分Splitter 清洗过滤文本分片RecursiveCharacterTextSplitter按字符 / 语义切块chunk解决超长文本向量化丢失细节数据清洗剔除空行、乱码、无效符号、水印冗余内容输出多段短文本 Chunk小块文档是后续 Embedding 的最小单元。拓展优化ParentDocumentRetriever 在这里做大小双切片小切片用于向量检索、大切片留存原文。4. Embed向量化编码原理调用 Embedding 模型OpenAIEmbedding、BGE、text-embedding 系列将自然语言 Chunk 转为多维浮点向量如图中[0.5,0.2...]数字数组语义相近的文本向量空间距离更近。关键点文字→数学向量是向量相似度检索的数学基础。5. Store向量持久化入库功能文本向量原文档元数据一并存入向量数据库Chroma/FAISS/Milvus/PGVector永久落盘存储。两种存储向量存入向量库索引用于相似度计算原文 Document向量库 / 外置文档库留存召回后返回原文。前 5 步统称RAG 知识库构建阶段离线建库一次性批量执行6. Retrieve在线检索用户提问阶段用户提问触发在线实时执行RAG 推理阶段用户 Query → 同样经过 Embedding 生成提问向量向量库做余弦相似度计算召回 Top-K 最相似的 Chunk 文档召回文档拼接进 Prompt送入 LLM 生成答案两种落地形态✅ 固定 RAGRetrieve 固定嵌入 LCEL 链路所有提问强制检索 ✅ Agent-RAGRetriever 封装 ToolLLM 按需自主调用检索。二、结合之前知识点关联Retriever 本质就是Retrieve环节的代码封装BaseRetriever 所有子类ChromaRetriever/BM25/Ensemble 等全部实现该步骤RAG 离线建库 (Source~Store) 在线检索 (Retrieve)Memory vs RAG本流程产出的向量库 RAG 长期硬盘记忆LangChain Memory 是会话短期内存不在本流程内。三、工程优化节点全流程可优化位置Transform优化分片大小、重叠值避免上下文断裂Embed替换本地开源 Embedding 降低接口成本RetrieveMultiQueryRetriever/ContextualCompression/Ensemble 多路召回提升召回准确率。

别再只用随机数了！用LabVIEW 2018模拟真实温度传感器数据的3种方法

别再只用随机数了！用LabVIEW 2018模拟真实温度传感器数据的3种方法在工业自动化和实验室数据采集领域，温度数据的真实模拟往往被低估。许多开发者习惯用简单的随机数生成温度值，这种方法的局限性显而易见——它无法反映真实环境中温度变化的连…...

2026/6/5 4:42:04 阅读更多 →

HarmonyOS 6 安全控件系统焦点框样式使用文档

文章目录focusBox 组件说明核心作用完整代码focusBox 参数详解关键规则代码逐段解析1. 默认焦点框（无 focusBox）2. 紧贴控件的黑色焦点框3. 大尺寸红色焦点框4. 矩形按钮焦点框5. 圆形按钮焦点框总结focusBox 组件说明 focusBox 是 HarmonyOS 安全控…...

2026/6/5 4:41:27 阅读更多 →

SWAT建模避坑指南：HRU划分中土地利用/土壤数据重分类的那些‘坑’与最佳实践

SWAT建模避坑指南：HRU划分中土地利用/土壤数据重分类的那些‘坑’与最佳实践水文模型工作者常把SWAT比作"水文实验室"，而HRU（水文响应单元）则是这个实验室中最精密的反应容器。当这些"容器"出现问题时&#x…...

2026/6/5 4:39:38 阅读更多 →

智能水印工具终极指南：如何批量为照片添加专业相机参数水印

智能水印工具终极指南：如何批量为照片添加专业相机参数水印【免费下载链接】semi-utils 一个批量添加相机机型和拍摄参数的工具，后续「可能」添加其他功能。项目地址: https://gitcode.com/gh_mirrors/se/semi-utils 还在为数百张照片手动添加相…...

2026/6/3 17:02:45 阅读更多 →

Go语言可扩展性设计：水平扩展

Go语言可扩展性设计：水平扩展1. 引言在互联网时代，业务的快速增长对系统的扩展性提出了极高的要求。水平扩展（Scale Out）作为分布式系统的核心设计理念，能够通过增加服务器节点来提升系统的整体处理能力。与垂直扩展&…...

2026/6/3 11:01:44 阅读更多 →

Claude Code Tool System 与 Permission 机制深度解析

代码解析 Claude Code Tool System 与 Permission 机制深度解析 0. 背景与定位 Claude Code 是一个运行在终端的 Agentic 编码工具，其核心能力来自工具系统（Tool System）——AI 通过调用工具与文件系统、Shell、网络、子 Agent 交互。而**权…...

2026/6/3 17:02:49 阅读更多 →