Windows下MMDetection从安装到跑通第一个目标检测Demo（含权重文件下载与路径配置）

张

张建站

2026/6/2 3:51:34

10分钟阅读

Windows下MMDetection从安装到跑通第一个目标检测Demo（含权重文件下载与路径配置）

Windows下MMDetection从安装到跑通第一个目标检测Demo在计算机视觉领域目标检测是一项基础而重要的任务。对于Windows平台的学习者和开发者来说如何在个人电脑上快速搭建目标检测环境并运行第一个Demo往往是入门的第一道门槛。本文将手把手带你完成MMDetection在Windows系统下的完整安装和配置流程特别针对Windows用户常见的路径配置、权重文件下载等问题提供解决方案。1. 环境准备与基础安装1.1 创建Python虚拟环境首先我们需要创建一个独立的Python环境避免与系统已有环境产生冲突。推荐使用Anaconda进行环境管理conda create --name mmdet python3.8 -y conda activate mmdet提示建议使用Python 3.7-3.9版本这些版本与MMDetection的兼容性最好1.2 安装PyTorch框架PyTorch是MMDetection的底层依赖版本选择至关重要。根据官方文档建议我们安装CUDA 11.8对应的PyTorch 2.1.0版本pip install torch2.1.0 torchvision0.16.0 torchaudio2.1.0 --index-url https://download.pytorch.org/whl/cu118安装完成后可以通过以下命令验证是否安装成功import torch print(torch.__version__) # 应输出2.1.0 print(torch.cuda.is_available()) # 应输出True2. 安装MMCV与MMDetection2.1 安装MMCVMMCV是OpenMMLab系列工具包的基础库需要特别注意与PyTorch版本的对应关系pip install -U openmim mim install mmengine mim install mmcv2.1.02.2 安装MMDetection使用MIM工具安装MMDetection可以自动处理依赖关系mim install mmdet安装完成后可以通过以下命令验证安装是否成功import mmdet print(mmdet.__version__) # 应输出3.3.0或更高版本3. 获取源码与权重文件3.1 下载MMDetection源码推荐从GitHub克隆最新版本的MMDetectiongit clone https://github.com/open-mmlab/mmdetection.git cd mmdetection注意Windows用户可以直接在文件资源管理器地址栏输入cmd打开命令行窗口到当前目录3.2 下载预训练权重MMDetection需要预训练权重文件才能运行检测任务。我们以Faster R-CNN模型为例在mmdetection目录下创建checkpoints文件夹下载权重文件 faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth将权重文件放入checkpoints文件夹4. 运行第一个目标检测Demo4.1 准备测试图像在mmdetection目录下创建demo文件夹放入一张测试图像如demo.jpg。也可以使用官方提供的示例图像。4.2 创建测试脚本新建demo.py文件内容如下from mmdet.apis import init_detector, inference_detector from mmdet.registry import VISUALIZERS import mmcv # 配置文件路径 config_file configs/faster_rcnn/faster-rcnn_r50_fpn_1x_coco.py # 权重文件路径 checkpoint_file checkpoints/faster_rcnn_r50_fpn_1x_coco_20200130-047c8118.pth # 测试图像路径 img demo/demo.jpg # 初始化模型 model init_detector(config_file, checkpoint_file, devicecuda:0) # 运行推理 result inference_detector(model, img) # 可视化结果 visualizer VISUALIZERS.build(model.cfg.visualizer) visualizer.dataset_meta model.dataset_meta image mmcv.imread(img) visualizer.add_datasample( result, image, data_sampleresult, draw_gtFalse, wait_time0, out_fileoutputs/result.jpg # 结果保存路径 )4.3 执行检测任务在命令行运行脚本python demo.py执行成功后结果将保存在outputs/result.jpg中。你会看到图像中的物体被检测出来并用边界框标记。5. 常见问题与解决方案5.1 DLL加载错误如果遇到类似DLL load failed while importing _ext的错误通常是版本不匹配导致的。检查以下组件版本是否对应组件推荐版本Python3.8PyTorch2.1.0CUDA11.8MMCV2.1.05.2 路径问题Windows下的路径需要使用正斜杠(/)或双反斜杠(\)# 正确 config_file configs/faster_rcnn/faster-rcnn_r50_fpn_1x_coco.py # 或 config_file configs\\faster_rcnn\\faster-rcnn_r50_fpn_1x_coco.py # 错误 config_file configs/faster_rcnn/faster-rcnn_r50_fpn_1x_coco.py5.3 显存不足如果遇到CUDA out of memory错误可以尝试使用更小的输入图像尺寸更换更轻量的模型如RetinaNet在init_detector时设置devicecpu使用CPU模式速度会慢很多6. 进阶配置与优化6.1 使用不同的预训练模型MMDetection支持多种目标检测模型只需更换配置文件和权重文件即可。例如使用Mask R-CNNconfig_file configs/mask_rcnn/mask-rcnn_r50_fpn_1x_coco.py checkpoint_file checkpoints/mask_rcnn_r50_fpn_1x_coco_20200205-d4b0c5d6.pth6.2 自定义数据集检测要检测自定义数据集需要准备数据集标注COCO或VOC格式修改配置文件中的数据集路径和类别数训练或微调模型6.3 性能优化技巧启用cudnn benchmark可以加速推理torch.backends.cudnn.benchmark True使用半精度浮点数(fp16)减少显存占用批量处理图像提高吞吐量在实际项目中我发现合理设置torch.backends.cudnn.benchmark可以带来约15%的推理速度提升特别是在处理固定尺寸的输入图像时效果更明显。另外对于部署场景建议将模型转换为TorchScript格式以获得更好的性能。

论多源数据集成及应用

在数字化与信息化高速发展的当下，数据已成为各行各业的核心生产要素。随着物联网、移动互联网、大数据技术的普及，数据来源愈发多元化，传感器采集数据、业务系统存储数据、第三方平台数据、社交媒体数据等海量异构数据持续涌现。这些数据存在…...

2026/6/2 3:49:22 阅读更多 →

Java+Vue分离式备忘录系统课程设计包（含MySQL脚本与双端可运行代码）

本文还有配套的精品资源，点击获取简介：直接能跑的备忘录系统，后端用SpringBoot写，Java语言开发，前端用Vue.js实现，前后端完全分离。包里有完整的Java项目源码（含pom.xml、启动脚本mvnw/mvnw…...

2026/6/2 3:46:57 阅读更多 →

实测对比：WIN10下修改串口延迟计时器，对Modbus RTU over 485的采集速度提升有多大？

WIN10串口延迟计时器优化对Modbus RTU通信性能的量化评测在工业自动化领域，Modbus RTU over 485通信协议因其简单可靠的特点，被广泛应用于PLC、传感器等设备的数据采集。然而，许多工程师在实际部署SCADA或MES系统时，常常会遇到通信…...

2026/6/2 3:46:03 阅读更多 →

智能水印工具终极指南：如何批量为照片添加专业相机参数水印

智能水印工具终极指南：如何批量为照片添加专业相机参数水印【免费下载链接】semi-utils 一个批量添加相机机型和拍摄参数的工具，后续「可能」添加其他功能。项目地址: https://gitcode.com/gh_mirrors/se/semi-utils 还在为数百张照片手动添加相…...

2026/5/31 0:06:17 阅读更多 →

Go语言可扩展性设计：水平扩展

Go语言可扩展性设计：水平扩展1. 引言在互联网时代，业务的快速增长对系统的扩展性提出了极高的要求。水平扩展（Scale Out）作为分布式系统的核心设计理念，能够通过增加服务器节点来提升系统的整体处理能力。与垂直扩展&…...

2026/6/1 0:54:56 阅读更多 →

Claude Code Tool System 与 Permission 机制深度解析

代码解析 Claude Code Tool System 与 Permission 机制深度解析 0. 背景与定位 Claude Code 是一个运行在终端的 Agentic 编码工具，其核心能力来自工具系统（Tool System）——AI 通过调用工具与文件系统、Shell、网络、子 Agent 交互。而**权…...

2026/6/1 3:24:00 阅读更多 →