摘要本数据集针对口腔疾病检测中病变特征识别难、人工诊断效率低等问题构建了包含3139张图像、3139个标注框的YOLO格式数据集涵盖龋齿、牙龈炎、口腔溃疡、牙结石、牙齿缺失、牙齿变色六类常见口腔疾病支持多尺度病变区域的高精度检测模型训练与评估数据集简介本数据集包含3488张口腔图像采用YOLO格式标注牙结石、龋齿、牙龈炎、牙齿缺失、口腔溃疡、牙齿变色六类口腔疾病按7:2:1比例划分为训练集2441张、验证集698张和测试集349张支持高精度检测模型训练与评估数据集概述本数据集专为口腔疾病检测任务构建包含3488张口腔图像共标注3488个病变目标。数据集采用标准YOLO格式涵盖牙结石Calculus、龋齿Caries、牙龈炎Gingivitis、牙齿缺失Hypodontia、口腔溃疡MouthUlcer、牙齿变色ToothDiscoloration六大类别按7:2:1比例划分为训练集2441张、验证集698张和测试集349张。所有图像来自真实临床环境病变区域尺寸多样对检测算法的泛化能力和精度提出了较高要求。数据集支持主流深度学习框架直接调用可用于目标检测模型的训练、验证和性能评估为口腔疾病智能诊断提供数据支撑。数据集来源本研究所使用的数据集为口腔疾病检测数据集图像数据来源于真实临床环境下口腔图像的采集、整理与筛选并在预处理后形成适用于目标检测任务的数据集。所有图像均采用YOLO格式进行边界框标注目标类别定义为牙结石Calculus、龋齿Caries、牙龈炎Gingivitis、牙齿缺失Hypodontia、口腔溃疡MouthUlcer、牙齿变色ToothDiscoloration六类共计标注了3616个病变实例。整个标注过程遵循统一规范以保证数据标注的一致性和准确性为后续YOLOv8及YOLOv8-CBAM模型训练、性能评估以及系统应用提供了可靠的数据支撑。类别定义标注规范标注采用 YOLO 格式每个目标一行字段为 class x_center y_center width height 坐标均为相对归一化0~1。图1 标注规范图数据规模与划分总图像数7,810张总标注框数12,119个图2 数据集在训练、验证和测试集上的分布数据集按照约 70:20:10 的比例划分为训练集、验证集和测试集图3 数据集划分及用途说明质量控制标注采用双阶段质量控制流程首先进行规范化标注与自检 确保目标框贴合实例外接矩形且类别一致随后进行抽样复核 针对漏标、错标与框位置偏差进行纠正。对争议样本进行二次确认 以提高跨标注者一致性与总体标注可靠性。数据格式与使用数据集采用标准 YOLO 格式组织通过 data.yaml 配置文件即可快速集成到训练流程中。目录结构数据集采用标准 YOLO 格式组织图像和标注文件分别存放在 images/ 和 labels/ 目录下并按训练集、验证集、测试集划分。性能评测基于 YOLO模型在本数据集上进行训练和评测使用mAP0.5与mAP0.5:0.95等标准指标对模型检测效果进行评估。评测结果如下训练过程综合指标曲线图图3 训练与验证指标随Epoch变化趋势图精确率-召回率PR曲线图图4 目标检测PR曲线Precision-RecallF1分数-置信度阈值曲线图图5 不同置信度阈值下的F1曲线归一化混淆矩阵图分类误判分析图6 归一化混淆矩阵person / leaflet应用案例案例1基于深度学习的口腔疾病图像识别系统图7 应用案例基于深度学习的口腔疾病图像识别系统免责声明与引用数据仅用于科研与教学用途。若用于商业场景请自行核验数据许可。 如需引用请在论文或报告中注明数据集名称与版本号。作者信息作者Bob (张家梁)项目编号Datasets-20数据大小337M原创声明本项目为原创作品