手把手教你：Windows+Docker 部署 Ollama + Qwen2:7B 纯 CPU 实战

张

张建站

2026/7/24 17:00:53

10分钟阅读

手把手教你：Windows+Docker 部署 Ollama + Qwen2:7B 纯 CPU 实战

一、准备工作已经安装 Docker或Docker Desktop。二、部署Ollama一拉取Ollama镜像拉取LTS 稳定版打开Power Shell或CMD窗口执行以下命令docker pull ollama/ollama:latest查看是否拉取Ollama镜像成功docker images列表里出现 ollama/ollama:latest 就是拉取成功。二启动容器测试CPU 模式打开Power Shell或CMD窗口执行以下命令docker run -d --name my-ollama -p 11434:11434 -v D:\Docker\docker_volumes\ollama_data:/root/.ollama ollama/ollama参数说明-d后台运行--name给容器名字-p端口映射默认 11434-v数据卷持久化模型 / 配置不会随容器删除丢失。三查看容器状态打开Power Shell或CMD窗口执行以下命令docker ps能看到 my-ollama running 就就代表镜像完全可用。三、访问测试访问 API 端口打开Power Shell或CMD窗口执行以下命令curl http://localhost:11434返回 Ollama is running 即成功。现在你的电脑就有了一个本地大模型服务。也可以在浏览器访问http://localhost:11434页面返回Ollama is running即表示成功。四、容器内部署模型一进入ollama容器内部打开Power Shell或CMD窗口执行以下命令:docker exec -it my-ollama bash二拉取模型执行以下命令qwen2:7b轻量适合本地运行ollama pull qwen2:7b模型下载时间跟网速有关。三运行模型执行以下命令运行模型ollama run qwen2:7b出现输入提示符代表CPU 运行大模型成功可以直接输入问题对话例如你好你是怎么出生的现在你已经有可以调用的模型了。五、外部调用 Ollama APIOllama 启动后默认提供REST API你的应用可以直接调用。一测试 API 连通性打开PowerShell或CMD窗口执行命令curl http://localhost:11434返回Ollama is running就代表Ollama启动成功。验证模型是否启动执行命令curl http://localhost:11434/api/generate -X POST -H Content-Type: application/json -d {\model\:\qwen2:7b\,\prompt\:\你好\,\stream\:false}要返回下边这段话就代表部署成功、模型运行正常{ model: qwen2:7b, response: , // 有这行就稳了 done: true }二Python 调用 Ollama APIimport requests # 本地 Docker Ollama 服务地址固定不变 OLLAMA_API http://localhost:11434/api/generate # 你要使用的模型必须和 docker 里运行的一致 MODEL_NAME qwen2:7b def ask_ollama(prompt): data { model: MODEL_NAME, # 你启动的模型名 prompt: prompt, # 你的问题 stream: False # 一次性返回结果 } try: # 发送请求 response requests.post(OLLAMA_API, jsondata) return response.json()[response].strip() except Exception as e: return f调用失败{e} if __name__ __main__: print(本地大模型已启动输入 quit or exit or q 退出) while True: user_input input(你) if user_input.lower() in [quit, exit, q]: break answer ask_ollama(user_input) print(AI, answer)执行以上代码控制台输出输出“你好”返回内容代表接口连接成功。六、Ollama常用接口# 多轮对话接口带上下文记忆 curl http://localhost:11434/api/chat # 单次文本补全接口无内置上下文 curl http://localhost:11434/api/generate应用场景用/api/chat聊天机器人、智能客服、多轮问答、带记忆的助手。用/api/generate写代码、写文案、摘要、翻译、一次性文本生成。七、常用管理命令# 停止 Ollama docker stop my-ollama # 启动 Ollama docker start my-ollama # 重启 Ollama docker restart my-ollama # 查看已安装模型 docker exec -it my-ollama ollama list # 安装模型 docker exec -it my-ollama ollama pull qwen2:7b # 启动已安装模型会自动下载 → 加载 → 进入聊天界面 docker exec -it my-ollama ollama run qwen2:7b # 停止正在运行模型 docker exec -it my-ollama ollama stop qwen2:7b # 查看正则运行模型 docker exec -it my-ollama ollama ps # 启动已安装模型只启动模型不进入聊天界面 docker exec -it my-ollama ollama stop qwen2:7b # 删除模型 docker exec -it my-ollama ollama rm qwen2:7b

3步突破平台壁垒：WorkshopDL让模组下载效率提升200%

3步突破平台壁垒：WorkshopDL让模组下载效率提升200% 【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 当你在Epic平台游玩《无主之地3》时，是否因无法访问…...

2026/7/24 16:59:35 阅读更多 →

MATLAB安装疑难杂症全攻略：从排查到修复的完整指南（附实用代码）

1. MATLAB安装前的系统检查清单每次帮学生处理MATLAB安装问题时，发现90%的故障其实都能通过事前检查避免。先分享我的"三查"原则：查系统、查硬件、查环境。最近遇到个典型案例，某高校实验室集体安装R2023a时全军覆没，…...

2026/7/13 18:11:10 阅读更多 →

别再只看EPE了！用Python分析双目相机深度误差，不同距离下误差曲线差异有多大？

别再只看EPE了！用Python分析双目相机深度误差，不同距离下误差曲线差异有多大？ 当你在机器人抓取系统中部署双目视觉算法时，是否遇到过这样的困惑：明明测试集的EPE指标很优秀，实际抓取时近处的零件定位却总出…...

2026/7/13 18:11:12 阅读更多 →

ReactOS.exe 安装程序分析

ReactOS.exe 安装程序分析概述 reactos.exe 是 ReactOS 的 GUI 第一阶段安装程序，位于 d:\reactos\base\setup\reactos\。它是一个 Win32 属性表（Property Sheet）向导，提供 7 步安装流程（欢迎 → 安装类型 → 设备 →…...

2026/7/24 12:41:32 阅读更多 →