AI学习——Docker 打包与部署

张

张建站

2026/6/3 23:34:57

10分钟阅读

Docker 打包与部署一、Docker 介绍二、我们要做什么三、项目结构四、第一步写 requirements.txt必须五、第二步写 Dockerfile核心六、第三步你的 main.pyRAG FastAPI七、第四步构建 Docker 镜像本地进入项目目录运行八、第五步本地运行测试九、第六步部署到服务器最关键1. 把项目文件夹传到服务器2. 服务器里执行构建同上3. 后台启动4. 访问服务器IP 端口十、Docker 常用命令一、Docker 介绍Docker 把你的代码环境依赖全部打包成一个“压缩包”镜像在哪都能跑不用装 Python、不用装库服务器/本地/云端完全一致答辩、部署、展示零环境问题二、我们要做什么把你之前的RAG 文档问答 FastAPI 接口打包成 Docker部署到服务器任何人都能调用。三、项目结构your_project/ ├── main.py # 你的 FastAPI RAG/Agent 代码 ├── requirements.txt # 依赖清单 └── Dockerfile # 打包配置我们写四、第一步写 requirements.txt必须创建文件requirements.txt写入fastapi uvicorn langchain langchain-openai langchain-community chromadb pypdf python-multipart beautifulsoup4 requests huggingface-hub五、第二步写 Dockerfile核心创建文件Dockerfile无后缀直接复制# 1. 基础 Python 环境 FROM python:3.11-slim # 2. 设置工作目录 WORKDIR /app # 3. 复制依赖文件 COPY requirements.txt . # 4. 安装依赖 RUN pip install --no-cache-dir -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple # 5. 复制全部代码 COPY . . # 6. 暴露端口 EXPOSE 8000 # 7. 启动命令 CMD [uvicorn, main:app, --host, 0.0.0.0, --port, 8000]六、第三步你的 main.pyRAG FastAPI# main.pyfromfastapiimportFastAPI,UploadFile,Filefromlangchain_community.document_loadersimportPyPDFLoaderfromlangchain.text_splitterimportRecursiveCharacterTextSplitterfromlangchain_community.vectorstoresimportChromafromlangchain_community.embeddingsimportHuggingFaceEmbeddingsfromlangchain_openaiimportChatOpenAIfromlangchain.chainsimportRetrievalQAimporttempfileimportos appFastAPI(titleRAG 文档问答 API)# 配置 LLMllmChatOpenAI(modelgpt-3.5-turbo,temperature0.1,api_key你的API_KEY,base_urlhttps://api.chatanywhere.tech/v1)embeddingsHuggingFaceEmbeddings(model_nameBAAI/bge-small-zh)vector_storeNone# 1. 上传文档构建知识库app.post(/upload)asyncdefupload(files:list[UploadFile]File(...)):globalvector_store docs[]forfileinfiles:suffixfile.filename.split(.)[-1]withtempfile.NamedTemporaryFile(deleteFalse,suffixf.{suffix})astmp:tmp.write(awaitfile.read())loaderPyPDFLoader(tmp.name)docs.extend(loader.load())splitterRecursiveCharacterTextSplitter(chunk_size500,chunk_overlap50)chunkssplitter.split_documents(docs)vector_storeChroma.from_documents(chunks,embeddings)return{status:ok,chunks:len(chunks)}# 2. 提问接口app.get(/ask)defask(question:str):ifnotvector_store:return{answer:请先上传文档}qaRetrievalQA.from_chain_type(llmllm,retrievervector_store.as_retriever(search_kwargs{k:3}))return{answer:qa.run(question)}# 3. 健康检查app.get(/)defhome():return{status:running,project:RAG Docker 部署}七、第四步构建 Docker 镜像本地进入项目目录运行dockerbuild-trag-app.等待 2–5 分钟构建完成八、第五步本地运行测试dockerrun-d-p8000:8000 rag-app打开浏览器访问 http://localhost:8000/docsAPI 界面直接出现九、第六步部署到服务器最关键1. 把项目文件夹传到服务器2. 服务器里执行构建同上dockerbuild-trag-app.3. 后台启动dockerrun-d\--restartalways\-p8000:8000\--namerag-app\rag-app4. 访问服务器IP 端口http://你的服务器IP:8000/docs部署完成全世界都能调用你的 AI 接口十、Docker 常用命令dockerbuild-t名字.# 构建镜像dockerrun-d-p8000:8000 名字# 运行dockerps# 查看运行中容器dockerlogs 容器ID# 查看日志dockerstop 容器ID# 停止dockerrestart 容器ID# 重启

科研云计算实战：Azure for Research培训与基因组数据分析工作流构建

1. 项目概述：面向研究人员的云端计算新路径作为一名长期在科研计算和数据密集型分析领域摸爬滚打的从业者，我深知算力瓶颈和数据孤岛对研究效率的制约。过去，搭建一个能满足复杂模拟、基因组测序或大规模社会网络分析的计算环境，往…...

2026/6/3 23:33:03 阅读更多 →

zCast项目：数据广播技术在移动设备上的应用潜力与设计思路

1. 项目概述：zCast与数据广播的潜力你有没有过这样的经历？在酒吧里，朋友兴奋地掏出手机说：“快看这个视频，笑死我了！”然后通过蓝牙或AirDrop把一段搞笑短片传给你。这种瞬间的、基于共同兴趣的社交分享&am…...

2026/6/3 23:24:04 阅读更多 →

别再把聊天记录全塞给模型：大模型上下文工程中的历史会话结构化摘要实战指南

大模型应用做得越久，越会发现一个残酷事实：真正拖慢系统、拉高成本、制造幻觉的，往往不是模型不够强，而是上下文塞得太乱。历史会话摘要不是“把前面聊过的内容压缩成一段话”这么简单。生产级上下文工程要做的是：把会…...

2026/6/3 23:23:39 阅读更多 →

智能水印工具终极指南：如何批量为照片添加专业相机参数水印

智能水印工具终极指南：如何批量为照片添加专业相机参数水印【免费下载链接】semi-utils 一个批量添加相机机型和拍摄参数的工具，后续「可能」添加其他功能。项目地址: https://gitcode.com/gh_mirrors/se/semi-utils 还在为数百张照片手动添加相…...

2026/6/3 17:02:45 阅读更多 →

Go语言可扩展性设计：水平扩展

Go语言可扩展性设计：水平扩展1. 引言在互联网时代，业务的快速增长对系统的扩展性提出了极高的要求。水平扩展（Scale Out）作为分布式系统的核心设计理念，能够通过增加服务器节点来提升系统的整体处理能力。与垂直扩展&…...

2026/6/3 11:01:44 阅读更多 →

Claude Code Tool System 与 Permission 机制深度解析

代码解析 Claude Code Tool System 与 Permission 机制深度解析 0. 背景与定位 Claude Code 是一个运行在终端的 Agentic 编码工具，其核心能力来自工具系统（Tool System）——AI 通过调用工具与文件系统、Shell、网络、子 Agent 交互。而**权…...

2026/6/3 17:02:49 阅读更多 →