PyTorch实战：3种方法提取ResNet50最后一层特征（附完整代码）

张

张建站

2026/5/4 12:15:49

10分钟阅读

PyTorch实战3种方法提取ResNet50最后一层特征附完整代码在计算机视觉任务中预训练模型的特征提取能力往往能带来意想不到的效果提升。ResNet50作为经典的卷积神经网络其深层特征蕴含着丰富的语义信息特别适合作为图像检索、目标检测等下游任务的输入特征。本文将手把手教你三种不同的方法从ResNet50中提取最后一层卷积特征每种方法都附带可直接运行的代码示例。1. 为什么需要提取中间层特征当我们使用预训练的ResNet50模型时默认的输出是经过全连接层后的1000维分类概率。但在很多实际应用中我们更关心的是模型中间层的特征表示。这些特征具有以下优势更强的泛化能力高层卷积特征比分类层输出更具迁移性空间信息保留最后一层卷积特征仍保持空间结构7x7x2048多任务适配同一组特征可用于分类、检索、检测等多种任务# 原始ResNet50输出示例 import torchvision.models as models model models.resnet50(pretrainedTrue) print(model) # 可以看到最后的全连接层 (fc): Linear(in_features2048, out_features1000)2. 方法一Sequential截取法这是最直观的特征提取方式通过重构模型结构直接截取到指定层。2.1 核心思路查看ResNet50的子模块结构去掉最后的全局池化层和全连接层将剩余部分组合成新的Sequential模型import torch.nn as nn from torchvision import models # 加载预训练模型 model models.resnet50(pretrainedTrue) model.eval() # 提取前n-2层去掉AvgPool和FC features nn.Sequential(*list(model.children())[:-2]) # 验证输出维度 dummy_input torch.randn(1, 3, 224, 224) print(features(dummy_input).shape) # torch.Size([1, 2048, 7, 7])2.2 完整流程代码from torchvision import transforms from PIL import Image import torch # 图像预处理 preprocess transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize(mean[0.485, 0.456, 0.406], std[0.229, 0.224, 0.225]) ]) # 加载图像 img Image.open(example.jpg) img_tensor preprocess(img).unsqueeze(0) # 特征提取 with torch.no_grad(): features features(img_tensor) features features.squeeze(0) # 去掉batch维度提示这种方法简单直接但当需要提取中间某层的特征时不够灵活。3. 方法二逐层前向传播控制对于需要更精细控制的情况可以手动控制前向传播过程。3.1 实现原理通过遍历模型的子模块在特定层停止前向传播model models.resnet50(pretrainedTrue) model.eval() # 打印所有子模块名称 for name, module in model.named_children(): print(name)输出会显示ResNet50的主要结构conv1 bn1 relu maxpool layer1 layer2 layer3 layer4 avgpool fc3.2 完整实现代码def extract_features(model, input_tensor): features None def hook(module, input, output): nonlocal features features output # 注册hook到layer4的最后一个ReLU handle model.layer4[-1].relu.register_forward_hook(hook) with torch.no_grad(): _ model(input_tensor) handle.remove() return features # 使用示例 features extract_features(model, img_tensor) print(features.shape) # torch.Size([1, 2048, 7, 7])4. 方法三Hook机制深度应用PyTorch的hook机制提供了最灵活的特征提取方式特别适合需要同时获取多层特征的场景。4.1 Hook工作原理Hook允许我们在不修改模型结构的情况下拦截各层的输入输出。有三种类型的hook前向hook获取层输出前向预hook获取层输入反向hook获取梯度信息4.2 特征提取实现class FeatureExtractor: def __init__(self, model, target_layers): self.model model self.target_layers target_layers self.features {} for layer_id in target_layers: layer dict([*self.model.named_modules()])[layer_id] layer.register_forward_hook(self.save_output) def save_output(self, module, input, output): self.features[module] output def __call__(self, x): self.model(x) return self.features # 使用示例 extractor FeatureExtractor(model, [layer4.2.relu]) features extractor(img_tensor)5. 三种方法对比与选型建议方法优点缺点适用场景Sequential实现简单运行效率高灵活性差只需最后一层特征逐层控制中等灵活性代码稍复杂需要中间某层特征Hook机制最大灵活性性能开销稍大需要多层级特征在实际项目中我通常会根据以下原则选择方法如果是生产环境且只需最后一层特征优先选择Sequential法当需要调试或分析中间层时使用Hook机制在需要平衡灵活性和性能时考虑逐层控制法# 性能对比测试代码 import time def test_speed(method, num_runs100): start time.time() for _ in range(num_runs): method(img_tensor) return (time.time() - start) / num_runs print(fSequential: {test_speed(features):.4f}s per run) print(fHook: {test_speed(lambda x: extract_features(model, x)):.4f}s per run)6. 特征后处理与应用示例提取到的特征通常需要进一步处理才能用于实际任务6.1 特征归一化def normalize_features(features): # 对每个特征向量做L2归一化 norm torch.norm(features, p2, dim1, keepdimTrue) return features / norm normalized_features normalize_features(features.squeeze())6.2 特征可视化import matplotlib.pyplot as plt def visualize_features(features): # 取前64个通道可视化 fig, axes plt.subplots(8, 8, figsize(12, 12)) for i, ax in enumerate(axes.flat): if i 64: ax.imshow(features[i].cpu().numpy(), cmapviridis) ax.axis(off) plt.show() visualize_features(features[0])6.3 实际应用案例图像检索from sklearn.neighbors import NearestNeighbors import numpy as np # 假设我们已经有一个特征数据库 database_features np.random.randn(1000, 2048) # 1000张图像的特征 nbrs NearestNeighbors(n_neighbors5).fit(database_features) # 查询图像 query_feature features.squeeze().cpu().numpy().reshape(1, -1) distances, indices nbrs.kneighbors(query_feature) print(f最相似的5张图像索引: {indices})7. 常见问题与解决方案Q1: 特征提取时出现CUDA内存不足错误解决方案减小batch size或在提取前调用torch.cuda.empty_cache()Q2: 提取的特征维度不符合预期# 检查各层输出形状的函数 def check_dimensions(model, input_size(1,3,224,224)): device next(model.parameters()).device x torch.randn(input_size).to(device) for name, module in model.named_children(): x module(x) print(f{name}: {x.shape})Q3: 预训练模型与自定义数据领域不匹配可以考虑在目标数据上微调最后一层使用领域自适应方法尝试其他预训练模型如CLIP# 部分微调示例 for param in model.parameters(): param.requires_grad False # 只微调layer4 for param in model.layer4.parameters(): param.requires_grad True在实际项目中我发现hook方法虽然灵活但在多线程环境下需要特别注意hook的注册和移除时机否则容易引起内存泄漏。而Sequential方法在TorchScript转换时更加友好适合部署到生产环境。

为什么你的C盘空间总是不够用？可能是Windows驱动文件在悄悄“发胖“

为什么你的C盘空间总是不够用？可能是Windows驱动文件在悄悄"发胖" 【免费下载链接】DriverStoreExplorer Driver Store Explorer 项目地址: https://gitcode.com/gh_mirrors/dr/DriverStoreExplorer 想象一下这样的场景：你的电脑C盘明明…...

2026/5/4 12:15:37 阅读更多 →

深入解析PEB结构：为什么隐藏调试器能解决x64dbg的MS_VC_EXCEPTION问题

深入解析PEB结构：为什么隐藏调试器能解决x64dbg的MS_VC_EXCEPTION问题调试器与反调试技术的博弈一直是Windows系统底层开发中的经典话题。当你在x64dbg中遇到406D1388或E06D7363这类异常时，可能已经踩中了调试检测的陷阱。本文将带你从PEB结构出发&…...

2026/4/11 18:42:11 阅读更多 →

万象视界灵坛CLIP零基础入门：5分钟搭建像素风AI图像识别平台

万象视界灵坛CLIP零基础入门：5分钟搭建像素风AI图像识别平台本文将带您快速搭建基于CLIP模型的像素风AI图像识别平台——万象视界灵坛。无需任何AI基础，只需5分钟即可完成部署，体验这款将复杂视觉识别转化为像素游戏的神奇工具。 1. 环境准…...

2026/4/11 18:42:15 阅读更多 →

UVa 173 Network Wars

题目分析本题设定在 212621262126 年，彗星 Swift‑Tuttle\texttt{Swift‑Tuttle}Swift‑Tuttle 撞击地球后，网络中的部分链接被切断，同时一些 AI\texttt{AI}AI 程序发生了变异。两个程序 Paskill\texttt{Paskill}Paskill 和 Lisper\texttt{…...

2026/5/4 9:12:02 阅读更多 →

MA-EgoQA：多智能体第一视角视频问答基准解析

1. 项目背景与核心价值在计算机视觉与自然语言处理的交叉领域，视频问答（VideoQA）一直是极具挑战性的研究方向。而当我们把视角聚焦在第一人称视频（Egocentric Video）时，问题会变得更加复杂——这类视频通常…...

2026/5/4 9:12:04 阅读更多 →

别再死记硬背DDR4时序参数了！用Python脚本自动解析JESD79-4标准文档，生成你的专属配置表

用Python解放DDR4开发：从JESD79-4标准文档自动生成配置工具当第一次打开JESD79-4标准文档时，大多数硬件工程师都会感到一阵眩晕——数百页的技术规范、错综复杂的时序参数、晦涩难懂的寄存器配置，这些内容不仅难以记忆，更在具体项…...

2026/5/4 9:12:06 阅读更多 →

Adobe扩展安装难题如何解决？ZXPInstaller让.zxp文件安装变得智能高效

Adobe扩展安装难题如何解决？ZXPInstaller让.zxp文件安装变得智能高效【免费下载链接】ZXPInstaller Open Source ZXP Installer for Adobe Extensions 项目地址: https://gitcode.com/gh_mirrors/zx/ZXPInstaller 还在为Adobe扩展安装而头疼吗？A…...

2026/5/4 9:12:09 阅读更多 →