手把手教你:Windows+Docker 部署 Ollama + Qwen2:7B 纯 CPU 实战
一、准备工作已经安装 Docker或Docker Desktop。二、部署Ollama一拉取Ollama镜像拉取LTS 稳定版打开Power Shell或CMD窗口执行以下命令docker pull ollama/ollama:latest查看是否拉取Ollama镜像成功docker images列表里出现 ollama/ollama:latest 就是拉取成功。二启动容器测试CPU 模式打开Power Shell或CMD窗口执行以下命令docker run -d --name my-ollama -p 11434:11434 -v D:\Docker\docker_volumes\ollama_data:/root/.ollama ollama/ollama参数说明-d后台运行--name给容器名字-p端口映射默认 11434-v数据卷持久化模型 / 配置不会随容器删除丢失。三查看容器状态打开Power Shell或CMD窗口执行以下命令docker ps能看到 my-ollama running 就就代表镜像完全可用。三、访问测试访问 API 端口打开Power Shell或CMD窗口执行以下命令curl http://localhost:11434返回 Ollama is running 即成功。现在你的电脑就有了一个本地大模型服务。也可以在浏览器访问http://localhost:11434页面返回Ollama is running即表示成功。四、容器内部署模型一进入ollama容器内部打开Power Shell或CMD窗口执行以下命令:docker exec -it my-ollama bash二拉取模型执行以下命令qwen2:7b轻量适合本地运行ollama pull qwen2:7b模型下载时间跟网速有关。三运行模型执行以下命令运行模型ollama run qwen2:7b出现输入提示符代表CPU 运行大模型成功可以直接输入问题对话例如你好你是怎么出生的现在你已经有可以调用的模型了。五、外部调用 Ollama APIOllama 启动后默认提供REST API你的应用可以直接调用。一测试 API 连通性打开PowerShell或CMD窗口 执行命令curl http://localhost:11434返回Ollama is running就代表Ollama启动成功。验证模型是否启动执行命令curl http://localhost:11434/api/generate -X POST -H Content-Type: application/json -d {\model\:\qwen2:7b\,\prompt\:\你好\,\stream\:false}要返回下边这段话就代表部署成功、模型运行正常{ model: qwen2:7b, response: , // 有这行就稳了 done: true }二Python 调用 Ollama APIimport requests # 本地 Docker Ollama 服务地址固定不变 OLLAMA_API http://localhost:11434/api/generate # 你要使用的模型必须和 docker 里运行的一致 MODEL_NAME qwen2:7b def ask_ollama(prompt): data { model: MODEL_NAME, # 你启动的模型名 prompt: prompt, # 你的问题 stream: False # 一次性返回结果 } try: # 发送请求 response requests.post(OLLAMA_API, jsondata) return response.json()[response].strip() except Exception as e: return f调用失败{e} if __name__ __main__: print(本地大模型已启动输入 quit or exit or q 退出) while True: user_input input(你) if user_input.lower() in [quit, exit, q]: break answer ask_ollama(user_input) print(AI, answer)执行以上代码控制台输出输出“你好”返回内容代表接口连接成功。六、Ollama常用接口# 多轮对话接口带上下文记忆 curl http://localhost:11434/api/chat # 单次文本补全接口无内置上下文 curl http://localhost:11434/api/generate应用场景用/api/chat聊天机器人、智能客服、多轮问答、带记忆的助手。用/api/generate写代码、写文案、摘要、翻译、一次性文本生成。七、常用管理命令# 停止 Ollama docker stop my-ollama # 启动 Ollama docker start my-ollama # 重启 Ollama docker restart my-ollama # 查看已安装模型 docker exec -it my-ollama ollama list # 安装模型 docker exec -it my-ollama ollama pull qwen2:7b # 启动已安装模型会自动下载 → 加载 → 进入聊天界面 docker exec -it my-ollama ollama run qwen2:7b # 停止正在运行模型 docker exec -it my-ollama ollama stop qwen2:7b # 查看正则运行模型 docker exec -it my-ollama ollama ps # 启动已安装模型只启动模型不进入聊天界面 docker exec -it my-ollama ollama stop qwen2:7b # 删除模型 docker exec -it my-ollama ollama rm qwen2:7b