【词汇专栏】向量数据库：RAG的弹药库

张

张建站

2026/4/14 19:49:18

10分钟阅读

向量数据库RAG的弹药库一句话理解向量数据库是AI时代的图书馆索引系统——不是按字母排序而是按语义相似度组织让AI能够快速找到意思相近的内容。2026年向量数据库已从可选项变成RAG和Agent系统的必选项。目录什么是向量数据库核心原理主流产品对比2026年最新动态实战代码选型指南常见问题延伸阅读读者互动1. 什么是向量数据库1.1 定义向量数据库Vector Database是一种专门存储和检索高维向量的数据库系统。对比维度传统数据库向量数据库查询语法SELECT * WHERE name AISELECT * WHERE similar TO machine匹配方式精确匹配语义相似示例name “AI”AI ≈ 机器学习1.2 为什么需要向量数据库场景传统方案向量数据库搜索手机只返回含手机的结果返回iPhone、智能手机等语义理解关键词匹配理解意图图片搜索文件名匹配视觉特征匹配推荐系统规则匹配协同过滤1.3 核心应用场景向量数据库四大应用应用说明RAG 检索增强生成结合知识库提供更准确的生成语义搜索基于语义理解而非关键词匹配Agent 记忆系统为Agent提供长期记忆能力推荐系统个性化推荐和相似度匹配2. 核心原理2.1 向量化把内容变成数字嵌入Embedding将文本、图像等转换为向量# 文本向量化示例fromsentence_transformersimportSentenceTransformer modelSentenceTransformer(all-MiniLM-L6-v2)# 单条文本text人工智能是让机器具有人类智能的技术vectormodel.encode(text)print(f向量维度:{len(vector)})# 384维print(f向量示例:{vector[:5]}...)# [-0.0231, 0.0542, ...]# 批量文本texts[AI是什么,机器学习入门,深度学习教程]vectorsmodel.encode(texts)print(f向量矩阵:{vectors.shape})# (3, 384)2.2 相似度度量度量方式公式适用场景余弦相似度cos(θ) A·B/(|A||B|)文本嵌入欧氏距离√Σ(Aᵢ-Bᵢ)²图像向量点积A·B归一化向量指标说明向量A[1, 1] → 向量方向45°向量B[1, 0] → 向量方向0°cos(θ) 0.707 → 70.7%相似结论更近的方向更相似的语义2.3 近似最近邻ANN索引为什么需要ANN数据规模暴力搜索时间ANN搜索时间1,0001ms1ms100,000100ms1ms10,000,00010s10ms100,000,000100s100ms核心算法算法特点代表库HNSW图索引速度快Milvus, QdrantIVF倒排索引FaissPQ量化压缩FaissDiskANN磁盘索引大规模Microsoft层级结构作用Layer 2● ────── ●全局连接快速定位入口点Layer 1● ──● ──● ──●局部连接精细搜索Layer 0● ● ● ● ● ● ● ●底层数据点搜索流程从顶层快速定位 → 逐层下降 → 找到最近邻2.4 索引类型对比索引类型构建速度查询速度内存占用精度FLAT-慢大100%IVF_FLAT快中中95-99%HNSW快快大95-99%PQ很快快小85-95%HNSW_PQ很快很快小85-95%3. 主流产品对比3.1 产品一览产品类型GitHub特点Milvus开源43K Stars功能最全百亿级支持Pinecone云服务-零运维增长最快Qdrant开源25K StarsRust实现高性能Weaviate开源22K Stars原生多模态支持Chroma嵌入式15K Stars轻量级嵌入式FAISS库(Meta)30K Stars最成熟研究级3.2 详细对比表产品类型GitHub特点适合场景Milvus开源43K功能最全支持百亿级企业级大规模Pinecone云服务-零运维开箱即用快速上线Qdrant开源25KRust实现高性能实时检索Weaviate开源22K原生多模态多模态应用Chroma嵌入式15K轻量易用原型/POCFAISS库30KFacebook出品最成熟研究/离线3.3 选型建议问题选项推荐方案是否需要云服务Yes→ PineconeNo→ 继续判断开源方案No→ Chroma轻量POCYes→ 继续判断数据规模多大100M→ Milvus大规模其他→ Qdrant中小规模4. 2026年最新动态4.1 技术演进时间进展意义2025ChunkKV普及长文本检索效率提升2025Hybrid Search成熟关键词向量混合搜索2026.1ThinKV发布极致显存优化2026.2Graph-RAG整合图结构向量成为标配2026.4Agent Memory标配向量库成为Agent长期记忆4.2 2026年新趋势1. 混合检索成为标配阶段关键词检索 (BM25)向量检索 (Embedding)RRF融合用户查询“AI Agent的发展”同上-权重AI×0.3, Agent×0.4Agent×0.8, 发展×0.7Reciprocal Rank Fusion结果关键词匹配文档语义相似文档最终Top-K排序2. 与Agent深度整合# Agent记忆系统的向量数据库设计classAgentMemory:Agent的向量记忆库def__init__(self):# 短期记忆对话历史self.short_termMilvusCollection(short_term)# 长期记忆重要经验self.long_termMilvusCollection(long_term)# 知识库结构化知识self.knowledgeMilvusCollection(knowledge)defremember(self,experience):记忆存储vectorembed(experience)self.long_term.insert(vector,{content:experience})defrecall(self,query):记忆检索query_vectorembed(query)# 混合检索resultsself.long_term.search(query_vector,limit5,hybridTrue,# 启用混合检索rerankTrue# 重排序)returnresults5. 实战代码5.1 Milvus实战# Milvus向量数据库实战frompymilvusimportconnections,Collection,FieldSchema,CollectionSchema,DataTypefromsentence_transformersimportSentenceTransformer# 1. 连接Milvusconnections.connect(default,hostlocalhost,port19530)# 2. 定义Schemafields[FieldSchema(nameid,dtypeDataType.INT64,is_primaryTrue,auto_idTrue),FieldSchema(nameembedding,dtypeDataType.FLOAT_VECTOR,dim384),FieldSchema(nametext,dtypeDataType.VARCHAR,max_length65535),FieldSchema(namemetadata,dtypeDataType.JSON),]schemaCollectionSchema(fields,descriptionRAG Knowledge Base)# 3. 创建CollectioncollectionCollection(rag_knowledge,schema)# 4. 创建索引index_params{index_type:HNSW,metric_type:COSINE,params:{M:16,efConstruction:200}}collection.create_index(embedding,index_params)# 5. 插入数据modelSentenceTransformer(all-MiniLM-L6-v2)texts[RAG是检索增强生成技术,向量数据库用于存储嵌入向量,Agent可以调用工具完成任务]embeddingsmodel.encode(texts)entities[embeddings.tolist(),texts,[{source:doc1},{source:doc2},{source:doc3}]]collection.insert(entities)# 6. 检索collection.load()search_params{metric_type:COSINE,params:{ef:100}}query什么是RAG技术query_vectormodel.encode([query])resultscollection.search(query_vector.tolist(),embedding,search_params,limit3,output_fields[text,metadata])forhitinresults[0]:print(f文本:{hit.entity.get(text)})print(f相似度:{hit.score})5.2 Qdrant实战# Qdrant向量数据库实战fromqdrant_clientimportQdrantClient,modelsfromqdrant_client.modelsimportDistance,VectorParams,PointStruct# 1. 连接QdrantclientQdrantClient(localhost,port6333)# 2. 创建Collectionclient.create_collection(collection_namemy_collection,vectors_configVectorParams(size768,distanceDistance.COSINE),)# 3. 插入向量client.upsert(collection_namemy_collection,points[PointStruct(id1,vector[0.1]*768,payload{text:RAG技术简介,category:AI}),PointStruct(id2,vector[0.2]*768,payload{text:向量数据库原理,category:Database}),])# 4. 检索search_resultsclient.search(collection_namemy_collection,query_vector[0.15]*768,limit5,query_filtermodels.Filter(must[models.FieldCondition(keycategory,matchmodels.MatchValue(valueAI))]))5.3 Chroma轻量级实战# Chroma嵌入式向量数据库importchromadbfromchromadb.utilsimportembedding_functions# 1. 创建Chroma客户端clientchromadb.Client()# 2. 创建Collectioncollectionclient.create_collection(namemy_knowledge,embedding_functionembedding_functions.DefaultEmbeddingFunction())# 3. 添加文档collection.add(documents[RAG Retrieval Augmented Generation,向量数据库用于存储嵌入向量,Agent可以通过RAG获取知识],ids[doc1,doc2,doc3],metadatas[{source:web},{source:book},{source:paper}])# 4. 查询resultscollection.query(query_texts[什么是RAG],n_results2)print(results)6. 选型指南6.1 场景选型场景推荐选择原因快速POCChroma零配置易上手中小规模生产Qdrant性能好资源占用低大规模企业级Milvus功能全扩展性强云服务/零运维Pinecone全托管弹性扩展研究/实验FAISS最成熟灵活定制多模态应用Weaviate原生支持图像等6.2 成本对比产品免费额度起步价/月按量付费Pinecone1GB$70/100M向量✅Milvus Cloud1M向量$25/100M向量✅Qdrant Cloud1GB$25✅Weaviate Cloud1GB$25✅Chroma完全免费--Milvus (自部署)免费基础设施成本-7. 常见问题Q1向量数据库和普通数据库有什么区别答核心区别在于检索方式。对比普通数据库向量数据库检索方式精确匹配近似匹配查询语言SQL向量相似度索引B树、哈希HNSW、IVF适用场景结构化数据非结构化数据Q2什么时候需要向量数据库答当需要语义搜索或相似性检索时。✅ 需要AI理解查询意图✅ 处理大量非结构化数据文本、图片✅ 构建RAG系统✅ Agent需要长期记忆❌ 简单关键词匹配就够用❌ 数据量很小1000条Q3向量数据库的精度和性能如何平衡答根据业务需求选择。需求推荐配置高精度HNSW (M32, ef200)均衡HNSW (M16, ef100)高性能PQ HNSW内存受限DiskANNQ4向量数据库会取代传统数据库吗答不会两者互补。向量数据库处理非结构化数据的语义检索传统数据库处理结构化数据的事务和精确查询最佳实践混合架构两者配合使用8. 延伸阅读相关词汇关联度推荐理由W03 RAG⭐⭐⭐⭐向量数据库是RAG的核心组件W12 嵌入⭐⭐⭐⭐嵌入是向量化的基础W04 Agent⭐⭐⭐Agent Memory依赖向量库W28 Agent记忆系统⭐⭐⭐⭐Agent Memory 向量库图库批判性思考1. 向量数据库是否过度工程化很多场景真的需要专门的向量数据库吗PostgreSQL pgvector是否已经足够2. 云服务vs自部署的权衡Pinecone等云服务是否会导致vendor lock-in自部署的运维成本是否被低估3. 数据安全问题向量数据库中存储的数据安全性如何保证敏感信息向量化后是否仍需加密4. 标准化问题各家向量数据库的API和数据格式不统一是否需要行业标准本文收录于「AI词汇专栏」作者孤岛站岗本文参考资料2026年4月《向量数据库完全指南》QubitTool 2026.2《向量数据库选型指南2026》Dev.toMilvus官方文档 2026.4《43K Star的向量数据库实测》腾讯云 2026.4

USACO竞赛全攻略：从青铜到白金的晋级之路（附备赛资源）

1. USACO竞赛入门：青铜组通关秘籍第一次接触USACO的新手们注意了，青铜组就是你们的起跑线。这个级别相当于编程界的"新手村"，主要考察基础编程能力和逻辑思维。我当年第一次参赛时，花了整整3小时才搞定第一道题&#…...

2026/4/14 19:49:15 阅读更多 →

AI Agent Harness Engineering 的安全性挑战与对策

AI Agent Harness Engineering 深度解析：安全性挑战与实践对策副标题：构建安全可靠的智能体控制框架摘要/引言问题陈述随着人工智能技术的快速发展，AI Agent（智能体）在各个领域的应用越来越广泛，从自动驾驶到智能客服，从金融交易到工业控制，AI Agent 正在深刻改…...

2026/4/14 19:48:38 阅读更多 →

015.Nor功能实现|千篇笔记实现嵌入式全栈/裸机篇

⚠️裸机仓库：https://gitee.com/simonchina_carel_li/mini2440-bare-metal.git ⚠️Tag: 15-nor 1. 要实现什么功能？ 读id 扇区擦除全片擦除字读写 CFI信息查询 2. AI分析数据手册以我手上的这颗Nor芯片为例，型号为S29AL016J&…...

2026/4/14 19:47:38 阅读更多 →

HagiCode Desktop 混合分发架构解析：如何用 PP 加速大文件下载籽

一、Actor 模型：不是并发技巧，而是领域单元 Actor 模型的本质是： Actor 是独立运行的实体 Actor 之间只通过消息交互 Actor 内部状态不可被外部直接访问 Actor 自行决定如何处理收到的消息 Actor 模型真正解决的是： 如何在不共享状…...

2026/4/14 21:51:12 阅读更多 →

从数据采集到回放验证：ADTF 适配 ROS 的 ADAS 测试实践饺

一、简化查询 1. 先看一下查询的例子 /// /// 账户获取服务 /// /// /// public class AccountGetService(AccountTable table, IShadowBuilder builder) {private readonly SqlSource _source new(builder.DataSource);private readonly IParamQuery _accountQuery build…...

2026/4/15 6:20:42 阅读更多 →