别再死记硬背公式了！用Python手把手带你复现PGD对抗攻击（附PyTorch代码）

张

张建站

2026/6/2 15:46:35

10分钟阅读

别再死记硬背公式了！用Python手把手带你复现PGD对抗攻击（附PyTorch代码）

实战指南用Python实现PGD对抗攻击提升模型鲁棒性在图像分类任务中我们常常会遇到一个令人头疼的问题——精心训练的模型在面对人为设计的微小扰动时竟然会给出完全错误的预测结果。这种现象被称为对抗样本攻击而PGDProjected Gradient Descent正是生成这类对抗样本的利器之一。本文将带你从零开始用Python实现一个完整的PGD攻击流程目标是在CIFAR-10数据集上欺骗一个预训练的ResNet模型。1. 对抗攻击基础与PGD原理对抗攻击的核心思想是在原始输入上添加人类难以察觉的微小扰动使得机器学习模型产生错误的输出。PGD作为当前最强大的白盒攻击方法之一其优势在于迭代优化通过多轮梯度更新逐步寻找最优扰动投影约束确保扰动始终保持在允许的范围内如L∞范数约束强攻击性在相同扰动预算下通常比单步攻击如FGSM更有效PGD的数学表达可以简化为以下迭代过程x_adv x delta # 初始扰动 for i in range(iterations): # 1. 计算损失函数关于输入的梯度 grad compute_gradient(loss, x_adv) # 2. 沿梯度方向更新扰动 delta delta alpha * sign(grad) # 3. 将扰动投影到允许范围内 delta clip(delta, -epsilon, epsilon) # 4. 确保扰动后的图像仍在有效像素范围内 x_adv clip(x delta, 0, 1)注意实际实现时需要考虑图像预处理、模型梯度计算等细节我们将在代码部分详细展开。2. 实验环境搭建与数据准备在开始编写攻击代码前我们需要准备好实验环境。以下是推荐的环境配置# 创建conda环境可选 conda create -n pgd_attack python3.8 conda activate pgd_attack # 安装核心依赖 pip install torch torchvision numpy matplotlib对于数据集我们将使用CIFAR-10和预训练的ResNet-18模型。PyTorch已经内置了这些资源import torch import torchvision from torchvision import transforms # 数据预处理 transform transforms.Compose([ transforms.ToTensor(), ]) # 加载CIFAR-10测试集 testset torchvision.datasets.CIFAR10( root./data, trainFalse, downloadTrue, transformtransform) testloader torch.utils.data.DataLoader( testset, batch_size32, shuffleFalse) # 加载预训练模型 model torchvision.models.resnet18(pretrainedTrue) model.eval() # 设置为评估模式3. PGD攻击的完整实现现在让我们实现PGD攻击的核心代码。我们将创建一个可配置的PGD攻击类支持调整关键参数class PGDAttack: def __init__(self, model, epsilon8/255, alpha2/255, iterations10, random_startTrue): self.model model self.epsilon epsilon # 扰动上限 self.alpha alpha # 单步扰动大小 self.iterations iterations self.random_start random_start def attack(self, images, labels): images images.clone().detach() labels labels.clone().detach() # 初始化扰动 if self.random_start: delta torch.empty_like(images).uniform_(-self.epsilon, self.epsilon) else: delta torch.zeros_like(images) delta torch.clamp(delta, -self.epsilon, self.epsilon) # 迭代攻击 for _ in range(self.iterations): delta.requires_grad True # 前向传播 outputs self.model(images delta) loss torch.nn.functional.cross_entropy(outputs, labels) # 反向传播计算梯度 grad torch.autograd.grad(loss, delta)[0] # 更新扰动 delta delta.detach() self.alpha * grad.sign() delta torch.clamp(delta, -self.epsilon, self.epsilon) # 确保图像仍在有效范围内 delta torch.clamp(images delta, 0, 1) - images return images delta关键参数说明参数典型值作用epsilon8/255允许的最大扰动L∞范数alpha2/255单次迭代的扰动步长iterations7-10攻击迭代次数random_startTrue是否随机初始化扰动4. 攻击效果评估与可视化实现攻击后我们需要评估其效果并可视化攻击样本。以下是评估攻击成功率的代码def evaluate_attack(model, dataloader, attack): correct 0 total 0 for images, labels in dataloader: # 生成对抗样本 adv_images attack.attack(images, labels) # 模型预测 outputs model(adv_images) _, predicted torch.max(outputs.data, 1) total labels.size(0) correct (predicted labels).sum().item() accuracy 100 * correct / total print(fAttack success rate: {100 - accuracy:.2f}%) return accuracy可视化原始图像与对抗样本的对比import matplotlib.pyplot as plt def visualize_attack(original, adversarial, epsilon): plt.figure(figsize(10, 5)) # 原始图像 plt.subplot(1, 3, 1) plt.imshow(original.permute(1, 2, 0)) plt.title(Original) plt.axis(off) # 对抗样本 plt.subplot(1, 3, 2) plt.imshow(adversarial.permute(1, 2, 0)) plt.title(fAdversarial (ε{epsilon})) plt.axis(off) # 扰动放大 plt.subplot(1, 3, 3) perturbation (adversarial - original).abs().sum(dim0) plt.imshow(perturbation, cmaphot) plt.title(Perturbation Magnified) plt.axis(off) plt.tight_layout() plt.show()5. 防御策略与模型鲁棒性提升了解攻击方法后我们自然需要考虑如何防御。以下是几种常见的防御策略对抗训练在训练过程中加入对抗样本优点直接有效缺点训练成本高可能影响原始准确率输入预处理随机化随机调整大小、填充等去噪使用自编码器或滤波技术梯度掩码使模型梯度对攻击者不可用或难以利用但可能只是虚假的安全感以下是简单的对抗训练实现示例def adversarial_train(model, train_loader, optimizer, attack, epochs5): model.train() # 设置为训练模式 for epoch in range(epochs): for images, labels in train_loader: # 生成对抗样本 adv_images attack.attack(images, labels) # 同时使用原始样本和对抗样本训练 optimizer.zero_grad() outputs model(torch.cat([images, adv_images])) loss F.cross_entropy( outputs, torch.cat([labels, labels])) loss.backward() optimizer.step()在实际项目中我发现对抗训练虽然能显著提升模型鲁棒性但也需要平衡几个关键因素训练时间与计算资源的消耗原始测试集准确率的保持对不同攻击方法的泛化能力一个实用的技巧是从较小的epsilon开始如4/255随着训练过程逐步增大这样可以在保持模型原始性能的同时提升鲁棒性。

STM32F103驱动舵机避坑指南：SG90和MG995接5V到底行不行？实测电压与PWM占空比的关系

STM32F103驱动舵机避坑指南：SG90和MG995接5V到底行不行？实测电压与PWM占空比的关系在嵌入式开发中，舵机控制是一个基础但容易踩坑的环节。很多教程会告诉你"接5V就行"，但实际应用中，电源质量、电压波动、舵…...

2026/6/2 15:45:47 阅读更多 →

基于ESP32与FreeRTOS的桌面机器人：从RTOS原理到物联网实践

1. 项目概述：一个能陪你办公的桌面小精灵几年前，当我第一次把一堆电子元件和3D打印件拼凑成一个能自己动的小方块时，那种纯粹的快乐至今难忘。桌面机器人，或者说“桌宠”，一直是我业余时间最喜欢折腾的方向。它不像工业…...

2026/6/2 15:45:28 阅读更多 →

如何用 GriddyCode 打造你的终极个性化代码编辑器：从入门到精通完整指南

如何用 GriddyCode 打造你的终极个性化代码编辑器：从入门到精通完整指南【免费下载链接】griddycode A code editor made with Godot. Code has never been more lit! 项目地址: https://gitcode.com/GitHub_Trending/gr/griddycode GriddyCode 是一款基于 …...

2026/6/2 15:44:58 阅读更多 →

智能水印工具终极指南：如何批量为照片添加专业相机参数水印

智能水印工具终极指南：如何批量为照片添加专业相机参数水印【免费下载链接】semi-utils 一个批量添加相机机型和拍摄参数的工具，后续「可能」添加其他功能。项目地址: https://gitcode.com/gh_mirrors/se/semi-utils 还在为数百张照片手动添加相…...

2026/6/2 10:07:16 阅读更多 →

Go语言可扩展性设计：水平扩展

Go语言可扩展性设计：水平扩展1. 引言在互联网时代，业务的快速增长对系统的扩展性提出了极高的要求。水平扩展（Scale Out）作为分布式系统的核心设计理念，能够通过增加服务器节点来提升系统的整体处理能力。与垂直扩展&…...

2026/6/2 10:07:52 阅读更多 →

Claude Code Tool System 与 Permission 机制深度解析

代码解析 Claude Code Tool System 与 Permission 机制深度解析 0. 背景与定位 Claude Code 是一个运行在终端的 Agentic 编码工具，其核心能力来自工具系统（Tool System）——AI 通过调用工具与文件系统、Shell、网络、子 Agent 交互。而**权…...

2026/6/2 10:07:56 阅读更多 →