LangChain_03_RAG与中间件

张

张建站

2026/5/16 6:11:40

10分钟阅读

LangChain 1.0 RAG 与中间件系列第三篇：从文档问答到生产级 Agent 防护前言前两篇建立了 LangChain 1.0 的核心认知：Model I/O 负责与模型交互，Agent + Tools 负责执行复杂任务。本篇聚焦两个生产关键能力：RAG（Retrieval-Augmented Generation）：让模型能够基于你的私有文档/数据库回答问题，而不是凭空编造。中间件（Middleware）：在 Agent 的生命周期中插入拦截逻辑，实现安全过滤、成本控制、人工审批等生产级需求。一、RAG 原理与数据管道1.1 为什么需要 RAG大模型的知识是训练时冻结的。你的企业文档、最新新闻、私有数据库——模型一概不知。RAG 的解法：检索时增强，不修改模型，而是在每次提问前，先从外部数据源检索相关内容，把它作为上下文拼入 Prompt，再让模型回答。用户提问 ↓ 向量化问题 ↓ 在向量数据库中检索最相似的文档片段 ↓ 将文档片段 + 问题一起发给 LLM ↓ LLM 基于文档内容生成回答

Nucleus Co-Op：突破硬件限制的本地多人游戏革新方案

Nucleus Co-Op：突破硬件限制的本地多人游戏革新方案【免费下载链接】nucleuscoop Starts multiple instances of a game for split-screen multiplayer gaming! 项目地址: https://gitcode.com/gh_mirrors/nu/nucleuscoop Nucleus Co-Op是一款开源分屏游戏工…...

2026/5/9 1:13:32 阅读更多 →

ReAct、CoT 和 ToT：大模型提示词推理架构的实战应用指南

1. 从理论到实践：三种推理架构的本质区别第一次接触ReAct、CoT和ToT时，很多人会被各种术语绕晕。我在实际项目中反复验证后发现，这三种架构最本质的区别在于思考方式的不同。就像下棋，有人喜欢直线进攻（CoT&#xff0…...

2026/5/9 1:13:32 阅读更多 →

Docker Desktop + WSL 2 终极配置指南：从零搞定 PostgreSQL 和 Redis 开发环境

Docker WSL 2 开发环境全栈配置：PostgreSQL与Redis高效部署实战在Windows系统上进行数据库开发时，环境配置往往是第一个拦路虎。传统虚拟机笨重缓慢，原生安装又面临版本管理和系统污染的困扰。如今，Docker与WSL 2的组合为Window…...

2026/5/9 1:13:33 阅读更多 →

CANN/ops-transformer FlashAttention V2

aclnnFlashAttentionScoreV2 【免费下载链接】ops-transformer 本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-transformer 产品支持情况产品是否支持Ascend 950PR/Ascend 950DTAtlas A…...

2026/5/15 11:05:35 阅读更多 →