YOLO11 全面笔记从网络结构到训练、推理解码与源码阅读阅读目标看完这一篇后能够回答 YOLO11 与 YOLOv8 的核心差异、各模块的作用、Anchor-Free 和 DFL 如何解码检测框、训练阶段如何分配正样本以及源码应当按照什么顺序阅读。本文重点介绍 Ultralytics 官方标准目标检测模型yolo11.yaml。实例分割、姿态估计、旋转框检测和分类模型与检测模型共享部分思想但任务头不同。0. 一页结论先建立整体印象YOLO11 可以理解为YOLO11 YOLOv8 的 Anchor-Free 检测框架 Backbone 和 Neck 中大量 C2f → C3k2 Backbone 末端 SPPF 后加入 C2PSA 重新调整网络深度、宽度和最大通道数YOLO11 没有推翻 YOLOv8 的检测逻辑。下面这些核心机制仍然保留P3、P4、P5 三尺度检测 Anchor-Free围绕网格参考点预测框 DFL四条边的分布式回归 分类与回归分支解耦 Task-Aligned Assigner训练阶段分配正负样本 标准推理流程置信度筛选 NMS最需要牢记的对比对比项YOLOv8YOLO11Backbone 主模块C2fC3k2Neck 融合模块C2fC3k2Backbone 末端SPPFSPPF → C2PSA检测尺度P3、P4、P5P3、P4、P5检测方式Anchor-FreeAnchor-Free框回归DFLDFL标准推理后处理NMSNMS一个措辞上的小纠正不要说“主干网格部分换成了 C3k2”。更准确的说法是YOLO11 将 Backbone 和 Neck 中大量使用的 C2f 模块替换为 C3k2网格通常用于描述 Detect Head 中的特征图参考点。1. YOLO11 是什么YOLO11 是 Ultralytics 在 2024 年 9 月发布的一代 YOLO 系列模型。官方支持五类任务任务常见权重文件输出结果目标检测yolo11n.pt水平检测框、类别、分数实例分割yolo11n-seg.pt检测框、类别、实例掩膜图像分类yolo11n-cls.pt整张图像的类别姿态估计yolo11n-pose.pt关键点及其置信度旋转框检测yolo11n-obb.pt带角度的旋转框官方提供n、s、m、l、x五种规模。它们共享同一套整体骨架但使用不同的深度、宽度和最大通道数配置。需要注意Ultralytics 没有为 YOLO11 单独发布正式研究论文。因此学习 YOLO11 时官方文档、官方 YAML 和源码比网上二次整理图更可靠。2. 学习前需要掌握的基础词汇2.1 Backbone、Neck 和 Detect Head目标检测网络通常可以拆成三个部分输入图片 ↓ Backbone提取不同层级的视觉特征 ↓ Neck融合浅层细节和深层语义 ↓ Detect Head预测类别和边界框Backbone 类似“视觉特征提取器”。浅层更容易捕获颜色、边缘和纹理深层更容易理解目标整体结构和语义。Neck 类似“信息交换枢纽”。它把高层语义传给浅层也把浅层定位信息重新传回深层。Detect Head 是最终预测模块。它接收 P3、P4、P5 三个尺度的融合特征输出分类信息和边界框信息。2.2 特征图、Stride 和 P3/P4/P5假设输入图片为640 × 640特征层Stride特征图尺寸位置数量更擅长处理P3880 × 806400小目标P41640 × 401600中等目标P53220 × 20400较大目标总参考点数量为80 × 80 40 × 40 20 × 20 8400Stride 为 8 表示特征图上相邻位置在输入图尺度上大约相隔 8 个像素。3. YOLO11 总体网络结构图假设输入尺寸为640 × 640 × 3标准检测模型的数据流如下YOLO11 输入图片 640 × 640 × 3 │ ▼ ┌────────────────────────── Backbone ──────────────────────────┐ │ │ │ Conv, stride2 → P1/2 │ │ 320 × 320 │ │ │ │ │ Conv, stride2 → P2/4 │ │ 160 × 160 │ │ │ │ │ C3k2 │ │ │ │ │ Conv, stride2 → P3/8 │ │ 80 × 80 ──────────────────────────────────────────┐ │ │ │ │ │ │ C3k2 │ │ │ │ │ │ │ Conv, stride2 → P4/16 │ │ │ 40 × 40 ───────────────────────────────┐ │ │ │ │ │ │ │ │ C3k2 │ │ │ │ │ │ │ │ │ Conv, stride2 │ → P5/32 │ │ │ 20 × 20 │ │ │ │ │ │ │ │ │ C3k2 │ │ │ │ │ │ │ │ │ SPPF │ │ │ │ │ │ │ │ │ C2PSA │ │ │ └────────┼───────────────────────────────┼───────────┼──────────┘ │ │ │ ▼ │ │ ┌──────────────────────────── Neck ─────────────────────────────┐ │ │ │ 深层 P5 │ │ │ │ │ ├─ Upsample │ │ ▼ │ │ 40 × 40 ── Concat ◄──────────────── Backbone P4 │ │ │ │ │ C3k2 │ │ │ │ │ ├─ Upsample │ │ ▼ │ │ 80 × 80 ── Concat ◄──────────────── Backbone P3 │ │ │ │ │ C3k2 ─────────────────────────────────────────────► 输出 P3 │ │ │ │ │ ├─ Conv, stride2 │ │ ▼ │ │ 40 × 40 ── Concat ◄──────────────── 中间融合特征 │ │ │ │ │ C3k2 ─────────────────────────────────────────────► 输出 P4 │ │ │ │ │ ├─ Conv, stride2 │ │ ▼ │ │ 20 × 20 ── Concat ◄──────────────── C2PSA 深层特征 │ │ │ │ │ C3k2 ─────────────────────────────────────────────► 输出 P5 │ └───┬──────────────────────────────────────────────────────────┘ │ ▼ Detect(P3, P4, P5) │ ▼ 边界框分布 类别分数 │ ▼ DFL 解码 → 置信度筛选 → NMS │ ▼ 最终检测结果概念上分为 Backbone、Neck 和 Detect Head。但在 Ultralytics 的 YAML 文件中head:部分同时包含 Neck 的特征融合层和最后的Detect层。4. 如何阅读yolo11.yaml标准 YAML 中每一行通常采用下面的结构[from,repeats,module,args]含义如下字段含义示例from输入来自哪一层-1表示上一层[-1, 6]表示将上一层和第 6 层共同作为输入repeats模块基础重复次数[ -1, 2, C3k2, ... ]module模块类型Conv、C3k2、SPPF、C2PSA、Concat、Detectargs模块参数输出通道数、卷积核大小、步长等官方标准结构的核心可以概括为backbone:-Conv-Conv-C3k2-Conv# P3/8-C3k2-Conv# P4/16-C3k2-Conv# P5/32-C3k2-SPPF-C2PSAhead:-Upsample-Concat# 融合 Backbone P4-C3k2-Upsample-Concat# 融合 Backbone P3-C3k2# 输出 P3-Conv# 下采样-Concat-C3k2# 输出 P4-Conv# 下采样-Concat-C3k2# 输出 P5-Detect# Detect(P3, P4, P5)4.1 模型缩放参数官方 YAML 为五个规模配置了不同缩放参数模型depthwidthmax_channelsYOLO11n0.500.251024YOLO11s0.500.501024YOLO11m0.501.00512YOLO11l1.001.00512YOLO11x1.001.50512可以这样理解depth控制模块重复次数 width控制通道数 max_channels限制最大通道数同一套 YAML 会根据规模参数生成不同大小的网络。5. 以 YOLO11n 为例逐层看尺寸变化下面的通道数按照官方 YAML 与YOLO11n的width0.25推导。输入图片假设为640 × 640。层号模块输入来源输出尺寸作用0Conv输入图像320 × 320 × 16第一次下采样1Conv0160 × 160 × 32第二次下采样2C3k21160 × 160 × 64提取浅层特征3Conv280 × 80 × 64下采样至 P3 尺度4C3k2380 × 80 × 128保存 Backbone P3 特征5Conv440 × 40 × 128下采样至 P4 尺度6C3k2540 × 40 × 128保存 Backbone P4 特征7Conv620 × 20 × 256下采样至 P5 尺度8C3k2720 × 20 × 256深层特征提取9SPPF820 × 20 × 256扩大感受野10C2PSA920 × 20 × 256强化重要区域和全局关系11Upsample1040 × 40 × 256上采样12Concat11 640 × 40 × 384拼接 Backbone P413C3k21240 × 40 × 128融合 P414Upsample1380 × 80 × 128上采样15Concat14 480 × 80 × 256拼接 Backbone P316C3k21580 × 80 × 64最终 P3小目标尺度17Conv1640 × 40 × 64下采样18Concat17 1340 × 40 × 192拼接中层特征19C3k21840 × 40 × 128最终 P4中目标尺度20Conv1920 × 20 × 128下采样21Concat20 1020 × 20 × 384拼接深层特征22C3k22120 × 20 × 256最终 P5大目标尺度23Detect16 19 22P3 P4 P5预测类别和边界框不同规模模型的通道数和模块重复次数不同但 P3、P4、P5 的空间尺度关系相同。6. Backbone 模块详解6.1 Conv卷积、归一化和激活YOLO 中的Conv通常不只是一次裸卷积而是一个组合模块。它负责提取局部特征 调整通道数 在 stride2 时完成下采样每次 stride2 后特征图宽高大约减半通道数通常增加。这样网络逐步把高分辨率图像压缩成更抽象的语义表示。6.2 先回忆 YOLOv8 的 C2fC2f 延续 CSP 思想。核心逻辑是输入特征 ↓ 卷积并拆分通道 ├───────────────┐ │ │ ▼ ▼ 保留部分特征 经过 Bottleneck 逐步加工 │ │ └──────┬────────┘ ▼ Concat │ ▼ 卷积融合它让一部分特征快速传递另一部分特征进行更深入计算在表达能力和计算成本之间取得平衡。6.3 YOLO11 的 C3k2YOLO11 大量使用C3k2。从官方源码看C3k2继承自C2f仍然保留“拆分—加工—拼接—融合”的总体框架但重写了内部模块组合方式。可以简化理解为输入 x │ ▼ 卷积并拆分 ├─────────────────┐ │ │ ▼ ▼ 快捷传递分支 深层加工分支 │ ├─ 普通 Bottleneck │ 或 └─ C3k 模块 │ │ └────────┬────────┘ ▼ Concat │ ▼ 卷积融合标准yolo11.yaml中可以看到C3k2,[256,False,0.25]C3k2,[512,False,0.25]C3k2,[512,True]C3k2,[1024,True]这里的True或False主要控制内部是否使用C3k路径。浅层通常偏轻量深层允许使用更充分的特征提取结构。常见误区k2不是 2 × 2 卷积核C3k2不能机械理解为“使用 2 × 2 卷积核”。官方源码中它是一个继承C2f的复合模块名称。重点在内部组合方式而不是简单更换卷积核尺寸。6.4 SPPF低成本扩大感受野SPPF 位于 Backbone 后部。它通过连续最大池化与特征拼接让网络以较低开销汇集不同范围的信息。深层输入 ├─ 原始特征 ├─ 池化一次 ├─ 池化两次 └─ 池化三次 ↓ Concat ↓ 卷积融合直觉上网络不仅看到某个局部纹理还能同时看到更大范围的上下文。6.5 C2PSA深层注意力模块YOLO11 在 SPPF 后增加C2PSAC3k2 → SPPF → C2PSA → NeckC2PSA 会先将特征拆成两个分支输入特征 │ ▼ 1 × 1 Conv │ ▼ 按通道拆分 ├──────────────────────┐ │ │ ▼ ▼ 分支 A直接保留 分支 B多个 PSABlock │ ├─ Attention └─ FFN │ │ └───────────┬──────────┘ ▼ Concat │ ▼ 1 × 1 Conv │ ▼ 输出PSABlock 内部包含注意力模块和前馈网络并使用残差连接。注意力部分会生成 Q、K、V计算不同空间位置之间的相关性并加入位置编码相关卷积。为什么把 C2PSA 放在深层假设输入为640 × 640P5 特征图通常只有20 × 20。在低分辨率特征图上建模全局关系成本比在浅层高分辨率特征图上做注意力更可控。7. Neck为什么要多尺度融合仅靠 Backbone 不够。浅层和深层特征各有优缺点特征层级优势不足浅层空间细节丰富定位更精细语义较弱深层语义更强容易识别目标整体空间分辨率较低YOLO11 的 Neck 采用类似 FPN PAN 的双向融合路径。7.1 自顶向下把深层语义传给浅层深层 P5 ↓ Upsample 与 Backbone P4 拼接 ↓ C3k2 融合 P4 ↓ Upsample 与 Backbone P3 拼接 ↓ C3k2 最终 P37.2 自底向上把定位信息重新传回深层最终 P3 ↓ stride2 Conv 与中间 P4 拼接 ↓ C3k2 最终 P4 ↓ stride2 Conv 与深层 P5 拼接 ↓ C3k2 最终 P5最后得到P3更适合小目标 P4兼顾语义和细节 P5更适合较大目标8. Detect HeadYOLO11 如何预测边界框8.1 Anchor-Free 到底是什么意思YOLOv5 是 Anchor-Based。每个网格位置会关联若干预先设定的 Anchor 宽高模板网络再预测相对于模板的偏移量。YOLO11 与 YOLOv8 类似采用 Anchor-Free 思路。它不依赖预设 Anchor 框宽高而是围绕特征图上的参考点预测四条边距离左边距离l 上边距离t 右边距离r 下边距离b参考点坐标为(cx, cy)时x1 cx - l y1 cy - t x2 cx r y2 cy b源码中仍然会出现make_anchors、anchor_points等命名但这些是网格参考点不是 YOLOv5 那种预设 Anchor 框模板。8.2 参考点位于哪里官方源码使用grid_cell_offset0.5生成参考点即参考点位于每个网格单元的中心附近0.5, 1.5, 2.5, 3.5, ...在不同尺度上解码后还需要乘以相应 stride映射回输入图尺度。8.3 每个位置输出多少个数当前标准 Detect Head 默认reg_max 16 输出通道数 nc 4 × reg_max其中nc类别数量 4左、上、右、下四条边 16每条边的离散分布桶数量对于 COCO 的 80 类检测4 × 16 80 144每个参考点输出 144 个数。对于自定义 3 类任务4 × 16 3 67每个参考点输出 67 个数。8.4 YOLO11 是否单独预测 Objectness标准 YOLO11 Detect Head 的输出通道公式是nc 4 × reg_max不是1 nc 4 × reg_max因此它没有 YOLOv5 风格的独立 Objectness 输出通道。推理时分类分支经过 Sigmoid 得到类别分数再进行阈值筛选和后处理。9. DFL为什么每条边要预测 16 个数DFL 即 Distribution Focal Loss 相关的分布式回归思路。传统方式可能直接回归l 4.05DFL 不直接输出单一浮点数而是预测多个离散位置的概率分布。例如左边距离的部分概率为离散位置概率30.1540.6550.20最终通过期望值恢复连续距离l 3 × 0.15 4 × 0.65 5 × 0.20 4.05这样既保留离散分类形式的稳定性又能得到连续值。9.1 为什么默认是 16这是表达能力和计算成本之间的工程折中reg_max回归输出通道数特点84 × 8 32更轻量但表达能力较弱164 × 16 64官方默认折中324 × 32 128表达能力更强但计算量、显存和输出通道更多16不是数学上的唯一正确答案而是实用默认值。10. YOLO11 训练阶段完整流程可以把训练过程拆成六步读取图片和标签 ↓ 数据增强与预处理 ↓ Backbone Neck Detect 前向传播 ↓ 生成不同尺度上的参考点 ↓ Task-Aligned Assigner 分配正负样本 ↓ 计算 Box、Cls、DFL 损失 ↓ 反向传播更新参数10.1 数据增强Ultralytics 训练管线支持 Mosaic、MixUp、随机透视变换、颜色调整等增强方式。实际项目中需要根据任务特征控制增强强度。例如医学图像中过度颜色扰动、翻转或形变可能破坏业务语义。10.2 Task-Aligned Assigner一张640 × 640输入图上有 8400 个参考点。训练时需要判断哪些位置负责学习某个真实目标Task-Aligned Assigner 不只是看参考点是否落入真实框而是综合分类预测质量和定位质量挑选更合适的正样本。直觉上候选点很多 ↓ 优先选择 分类更像目标 并且 预测框位置更准确 的参考点 ↓ 作为正样本参与训练10.3 三类主要损失YOLO11 标准检测训练主要计算损失项作用Box Loss让预测框与真实框更接近包含 IoU 类定位损失Classification Loss让类别预测更准确当前实现使用 BCEDFL Loss让四条边的距离分布更合理最终损失按超参数权重加权再反向传播。10.4 为什么源码里仍然能看到v8DetectionLossYOLO11 标准检测模型仍然复用了成熟的检测损失框架因此源码类名中可能保留v8DetectionLoss。这不代表加载的是 YOLOv8。工程源码中类名经常为了兼容性和复用而保留。判断实际模型时应结合 YAML、模型构建逻辑和运行配置。11. YOLO11 推理阶段完整流程标准推理可以拆成以下步骤输入图片 ↓ 缩放、填充、归一化等预处理 ↓ Backbone 提取多层特征 ↓ Neck 融合 P3、P4、P5 ↓ Detect Head 输出边界框分布和类别分数 ↓ DFL将每条边的离散分布转换为连续距离 ↓ 结合参考点和 stride 解码边界框 ↓ 分类 Logits 经过 Sigmoid ↓ 置信度筛选 ↓ NMS 去除重复框 ↓ 恢复到原始图像坐标11.1 为什么需要 NMS同一个真实目标附近通常会有多个参考点输出高分候选框。例如一只猫附近可能有框 A0.93 框 B0.88 框 C0.84这些框高度重叠。NMS 会优先保留高分框并根据 IoU 重叠程度抑制重复预测。11.2 标准 YOLO11 是不是 NMS-Free不是。当前通用 Detect 实现中可以看到可选的端到端模式但标准yolo11.yaml调用 Detect 时没有开启该选项。因此学习标准 YOLO11 检测模型时应按经典 NMS 后处理流程理解。12. YOLO11 和 YOLOv8 的详细对比12.1 结构对比对比项YOLOv8YOLO11影响Backbone 主模块C2fC3k2改进特征提取效率与灵活性Neck 主模块C2fC3k2改进多尺度融合阶段的特征加工Backbone 末端SPPFSPPF → C2PSA增强深层注意力与全局关系建模检测尺度P3、P4、P5P3、P4、P5保持多尺度检测能力Anchor 框模板不使用不使用均为 Anchor-Free边框表达l、t、r、b DFLl、t、r、b DFL基本延续正负样本分配Task-AlignedTask-Aligned基本延续标准后处理NMSNMS基本延续12.2 Backbone 并排图YOLOv8 Backbone YOLO11 Backbone 输入 输入 │ │ ▼ ▼ Conv Conv │ │ ▼ ▼ Conv Conv │ │ ▼ ▼ C2f C3k2 │ │ ▼ ▼ Conv Conv │ │ ▼ ▼ C2f C3k2 │ │ ▼ ▼ Conv Conv │ │ ▼ ▼ C2f C3k2 │ │ ▼ ▼ Conv Conv │ │ ▼ ▼ C2f C3k2 │ │ ▼ ▼ SPPF SPPF │ ▼ C2PSA12.3 Neck 并排图YOLOv8 Neck YOLO11 Neck Upsample Upsample │ │ Concat Concat │ │ C2f C3k2 │ │ Upsample Upsample │ │ Concat Concat │ │ C2f C3k2 │ │ Conv Conv │ │ Concat Concat │ │ C2f C3k2 │ │ Conv Conv │ │ Concat Concat │ │ C2f C3k212.4 官方 COCO 检测基准模型YOLO11 mAP50-95YOLOv8 mAP50-95YOLO11 参数量YOLOv8 参数量YOLO11 FLOPsYOLOv8 FLOPsn39.537.32.6M3.2M6.5B8.7Bs47.044.99.4M11.2M21.5B28.6Bm51.550.220.1M25.9M68.0B78.9Bl53.452.925.3M43.7M86.9B165.2Bx54.753.956.9M68.2M194.9B257.8B这些结果说明 YOLO11 的优化方向不是简单堆叠更大的网络而是在更少参数和计算量下提升精度。13. YOLO11 不同规模如何选择官方标准检测模型基准如下模型mAP50-95参数量FLOPsT4 TensorRT10 推理耗时YOLO11n39.52.6M6.5B1.5 msYOLO11s47.09.4M21.5B2.5 msYOLO11m51.520.1M68.0B4.7 msYOLO11l53.425.3M86.9B6.2 msYOLO11x54.756.9M194.9B11.3 ms实际选择建议场景建议起点快速验证、边缘设备、CPU 或弱算力设备YOLO11n大多数项目的初始精度与速度平衡YOLO11sGPU 服务端、希望进一步提高精度YOLO11m算力较充足且精度优先YOLO11l研究、高算力环境或精度压榨YOLO11x真实部署速度还会受到输入分辨率、Batch Size、硬件、导出格式、预处理和后处理实现影响。官方延迟只能作为基准参考。14. 自定义数据集与训练示例14.1 检测标签格式常见 YOLO 检测标签文件中每一行为class_id x_center y_center width height其中坐标通常归一化到01。示例0 0.512 0.486 0.320 0.27514.2 数据集 YAMLpath:/path/to/datasettrain:images/trainval:images/valnames:0:tongue1:sublingual2:invalid14.3 Python 训练、验证与推理fromultralyticsimportYOLO# 加载 COCO 预训练权重modelYOLO(yolo11n.pt)# 训练model.train(datadataset.yaml,epochs100,imgsz640,)# 验证metricsmodel.val()print(metrics.box.map)# mAP50-95# 推理resultsmodel(test.jpg)# 查看模型摘要model.info()# 查看 PyTorch 网络结构print(model.model)14.4 导出 ONNXfromultralyticsimportYOLO modelYOLO(best.pt)model.export(formatonnx)实际部署时还可以根据平台选择 TensorRT、OpenVINO、TFLite 等格式。导出后仍需验证数值一致性、后处理正确性和真实端到端性能。15. 常见误区集中纠正常见误区正确理解YOLO11 只替换了 Backbone 的 C2f不完整。Backbone 和 Neck 中大量 C2f 都换成了 C3k2C3k2表示 2 × 2 卷积核错。它是复合模块名称不应机械按卷积核尺寸理解Anchor-Free 意味着源码里完全没有 anchor 字样错。源码仍有anchor_points但它们是网格参考点不是预设 Anchor 框模板YOLO11 仍然有 YOLOv5 那样独立 Objectness 输出标准 Detect Head 没有单独 Objectness 通道C2PSA 分布在所有特征层标准 YOLO11 中它位于 Backbone 末端 SPPF 后YOLO11 完全重新设计了 Detect Head不准确。核心 Anchor-Free、DFL 和 P3/P4/P5 检测逻辑基本延续 YOLOv8标准 YOLO11 是 NMS-Free错。标准yolo11.yaml仍按经典 NMS 流程理解YOLO11 有官方正式论文官方文档明确说明没有单独正式论文应以官方文档和源码为准16. 源码阅读顺序推荐按下面顺序阅读不要一上来钻进全部源码1. ultralytics/cfg/models/11/yolo11.yaml ↓ 2. ultralytics/nn/modules/block.py 重点C3k2、C3k、SPPF、C2PSA、PSABlock、Attention ↓ 3. ultralytics/nn/modules/head.py 重点Detect、DFL、解码逻辑 ↓ 4. ultralytics/utils/tal.py 重点make_anchors、dist2bbox、TaskAlignedAssigner ↓ 5. ultralytics/utils/loss.py 重点v8DetectionLoss、BboxLoss、DFLoss ↓ 6. ultralytics/nn/tasks.py 重点模型构建、损失函数初始化阅读时始终围绕三个问题张量尺寸怎样变化 特征来自哪一层 这一模块解决了什么问题17. 最终速记卡17.1 网络结构速记YOLO11 YOLOv8 检测逻辑 Backbone / NeckC2f → C3k2 Backbone 末端SPPF → SPPF C2PSA17.2 检测头速记输入P3、P4、P5 参考点数80² 40² 20² 8400输入 640 时 每个点回归l、t、r、b 每条边16 个分布值 每个点输出4 × 16 nc 标准 Head没有独立 Objectness 通道17.3 训练速记前向传播 → 生成参考点 → Task-Aligned Assigner 分配正样本 → Box Loss Classification Loss DFL Loss → 反向传播17.4 推理速记预处理 → Backbone → Neck → Detect → DFL 解码 → 参考点 stride 恢复框 → Sigmoid 类别分数 → 置信度筛选 → NMS → 输出结果18. 官方资料索引以下资料适合作为后续查阅入口YOLO11 官方模型说明https://docs.ultralytics.com/models/yolo11/YOLO11 官方 YAMLhttps://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/models/11/yolo11.yamlYOLOv8 官方 YAMLhttps://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/models/v8/yolov8.yamlYOLO11 与 YOLOv8 官方对比https://docs.ultralytics.com/compare/yolo11-vs-yolov8/Block 模块参考https://docs.ultralytics.com/reference/nn/modules/block/Detect Head 参考https://docs.ultralytics.com/reference/nn/modules/head/Task-Aligned Assigner 与参考点工具https://docs.ultralytics.com/reference/utils/tal/损失函数参考https://docs.ultralytics.com/reference/utils/loss/导出模式https://docs.ultralytics.com/modes/export/