牙科结构与病变目标检测数据集:31类别 | 目标检测
牙科结构与病变目标检测数据集:31类别 | 目标检测
一、口腔医学的智能化变革浪潮
全球医疗数字化转型的浪潮中,口腔医学正经历一场深刻的智能化变革。随着数字化影像设备在口腔诊所和医院的普及,全景片、根尖片、锥形束CT(CBCT)等口腔影像数据呈现爆发式增长。一家中等规模的口腔诊所每天产生的影像数据量可达数百张,而大型口腔医院更是每日数千张。
但数据增长的背后,传统牙科影像分析依旧严重依赖人工阅片。经验丰富的口腔医生阅读一张全景片需要5~10分钟,一份完整的CBCT影像可能需要20分钟甚至更久。在繁忙的临床工作中,长时间高强度阅片效率低下,还容易因视觉疲劳导致漏诊和误诊。
更深层的问题在于,牙科影像的分析高度依赖医生的临床经验。不同年资的医生对同一影像的解读可能存在显著差异,尤其在复杂病例和多结构叠加的场景中。此外,口腔医学涵盖牙体牙髓、牙周病学、口腔修复、口腔种植、口腔正畸等多个专科,每个领域都有特定的影像分析要求,一名全科医生很难在所有领域都达到专家级阅片水平。
基于深度学习的牙科影像自动分析技术,为解决上述问题提供了突破性方案。通过训练目标检测模型,可以实现对牙科影像中关键结构与病变区域的自动检测和标注,辅助医生进行快速、准确、全面的影像分析。这种“AI + 医生”的协作模式,既能显著提高阅片效率,又能减少漏诊风险、提升诊断一致性,让医疗资源得到更高效的利用。

而这一切的基础,就是高质量的牙科影像标注数据集。本文全面解读的“31类常见牙科结构与病变目标检测数据集”,正是为推动口腔医学AI发展而构建的大规模、高精度数据资源。
二、牙科影像分析的独特挑战
2.1 结构复杂性
牙科影像中的结构复杂性远超一般医学影像:
- :在二维影像中,牙齿、牙槽骨、下颌神经管、上颌窦等多个结构相互叠加,边界模糊,难以清晰区分。
多结构叠加
- :不同牙齿的形态差异显著(切牙与磨牙),同一牙齿在不同角度下呈现不同形状。
形态多样性
- :不同患者的牙齿数量、排列方式、骨骼结构存在显著个体差异。
个体差异大
2.2 病变特征挑战
- :许多病变(如早期龋坏、骨吸收)的边界不清晰,与正常组织呈渐进性过渡。
边界模糊
- :从微小的早期龋坏到大范围的根尖周病变,病变尺度差异悬殊。
尺度差异大
- :同一疾病在不同阶段可能呈现不同的影像学表现,例如龋坏从釉质到牙本质的进展过程中影像特征变化显著。
表现多样
2.3 影像质量挑战
- :二维影像的空间分辨率有限,细微结构可能不够清晰。
分辨率限制
- :影像采集过程中可能产生噪声,影响分析精度。
噪声干扰
- :患者体位偏差可能导致影像失真或结构重叠异常。
体位影响

三、数据集全景解读
3.1 核心参数
本数据集是目前规模最大的牙科影像目标检测数据集之一,核心参数如下:
- :25000 张高质量牙科影像数据
数据总量
- :31类牙科结构与病变
类别数量
- :人工精细标注
标注方式
- :YOLO标准格式
标注格式
- :train / val / test
数据划分
- :YOLO系列、Faster R-CNN、RT-DETR、SSD等
适配模型
3.2 目录结构
DentalDataset/
├── images/
│ ├── train/
│ ├── val/
│ └── test/
└── labels/
├── train/
├── val/
└── test/
其中:images 文件夹用于存放图像数据,labels 文件夹用于存放标注文件,每张图片对应一个YOLO格式标注文件。
3.3 31类牙科结构与病变体系
数据集共包含31类目标,覆盖口腔医学的多个专科领域:
| 类别ID | 类别名称 | 中文 | 所属领域 |
|---|---|---|---|
| 0 | Caries | 龋齿 | 牙体牙髓 |
| 1 | Crown | 牙冠 | 口腔修复 |
| 2 | Filling | 充填体 | 牙体牙髓 |
| 3 | Implant | 种植体 | 口腔种植 |
| 4 | Malaligned | 错位牙 | 口腔正畸 |
| 5 | Mandibular Canal | 下颌神经管 | 口腔解剖 |
| 6 | Missing teeth | 缺失牙 | 口腔修复 |
| 7 | Periapical lesion | 根尖周病变 | 牙体牙髓 |
| 8 | Retained root | 残根 | 口腔外科 |
| 9 | Root Canal Treatment | 根管治疗 | 牙体牙髓 |
| 10 | Root Piece | 根尖片断 | 口腔外科 |
| 11 | Impacted tooth | 阻生牙 | 口腔外科 |
| 12 | Maxillary sinus | 上颌窦 | 口腔解剖 |
| 13 | Bone Loss | 骨吸收 | 牙周病学 |
| 14 | Fracture teeth | 牙齿断裂 | 口腔外伤 |
| 15 | Permanent Teeth | 恒牙 | 口腔解剖 |
| 16 | Supra Eruption | 伸长牙 | 口腔修复 |
| 17 | TAD | 种植支抗 | 口腔正畸 |
| 18 | Abutment | 基台 | 口腔种植 |
| 19 | Attrition | 磨损 | 牙体牙髓 |
| 20 | Bone defect | 骨缺损 | 牙周病学 |
| 21 | Gingival former | 愈合基台 | 口腔种植 |
| 22 | Metal band | 正畸金属环 | 口腔正畸 |
| 23 | Orthodontic brackets | 正畸托槽 | 口腔正畸 |
| 24 | Permanent retainer | 固定保持器 | 口腔正畸 |
| 25 | Post-core | 桩核 | 口腔修复 |
| 26 | Plating | 骨板 | 口腔外科 |
| 27 | Wire | 正畸弓丝 | 口腔正畸 |
| 28 | Cyst | 囊肿 | 口腔病理 |
| 29 | Root resorption | 牙根吸收 | 牙体牙髓 |
| 30 | Primary teeth | 乳牙 | 儿童口腔 |
3.4 类别体系特色
- :31类目标横跨牙体牙髓、牙周病学、口腔修复、口腔种植、口腔正畸、口腔外科、口腔病理、儿童口腔等多个专科领域,是目前覆盖面最广的牙科影像检测数据集之一。
多专科覆盖
- :既包含龋坏、根尖周病变、骨吸收、囊肿等疾病类别,也涵盖牙齿、种植体、正畸装置等正常结构与治疗装置类别,实现了“疾病诊断”与“结构识别”的双重覆盖。
疾病与结构并重
- :包含充填体、根管治疗、牙冠、种植体等治疗状态类别,能够辅助医生追踪患者的治疗历史和评估治疗效果。
治疗状态追踪
- :正畸托槽、金属环、弓丝、种植支抗、固定保持器等多个正畸相关类别的纳入,使数据集能够服务于正畸治疗规划与进展评估。
正畸专项覆盖

四、数据质量保障体系
4.1 数据规模
25000 张影像数据的规模在牙科AI领域属于顶尖水平,这一规模确保了:各类别有充足的训练样本,数据分布的多样性有保障,模型训练的泛化能力有基础,统计意义的分析结果可靠。
4.2 标注质量
- :标注工作由具有口腔医学背景的专业人员完成,确保类别判断的准确性。
专业标注团队
- :标注结果经过多轮质量审核,包括交叉验证和资深口腔医生复核。
多轮审核
- :对边界模糊的目标(如早期龋坏边界)制定了统一的标注规范,确保不同标注人员之间的一致性。
一致性控制
4.3 数据划分
按照train/val/test标准划分,确保:训练集足够大,支撑模型充分学习;验证集用于调参和早停,防止过拟合;测试集独立,评估结果客观可靠。
五、YOLOv8训练实战
5.1 数据配置文件
path: DentalDataset
train: images/train
val: images/val
names:
0: Caries
1: Crown
2: Filling
3: Implant
4: Malaligned
5: Mandibular Canal
6: Missing teeth
7: Periapical lesion
8: Retained root
9: Root Canal Treatment
10: Root Piece
11: Impacted tooth
12: Maxillary sinus
13: Bone Loss
14: Fracture teeth
15: Permanent Teeth
16: Supra Eruption
17: TAD
18: Abutment
19: Attrition
20: Bone defect
21: Gingival former
22: Metal band
23: Orthodontic brackets
24: Permanent retainer
25: Post-core
26: Plating
27: Wire
28: Cyst
29: Root resorption
30: Primary teeth
5.2 训练命令
yolo detect train data=data.yaml model=yolov8m.pt epochs=300 imgsz=640 batch=16
5.3 参数推荐
| 参数 | 推荐值 | 说明 |
|---|---|---|
| model | yolov8m / yolov8l | 31类需要强特征提取能力 |
| epochs | 300~500 | 多类别需充分训练 |
| imgsz | 640 / 768 | 小目标建议高分辨率 |
| batch | 8~16 | 大模型需更多显存 |
5.4 训练策略
- :31类数据可能存在类别不平衡,需要统计各类别样本数并设置相应权重。
类别权重调整
- :先使用较大学习率快速收敛,再逐步降低学习率精细优化。
渐进式训练
- :牙科影像中目标尺度差异大,多尺度训练有助于提升尺度适应能力。
多尺度训练
- :医学影像对增强策略需要谨慎选择,避免产生不合理的图像变换。
数据增强
六、应用场景深度剖析
6.1 牙科智能诊断系统
该数据集最直接的应用是构建牙科影像智能诊断系统,辅助医生进行阅片:
- :模型自动检测影像中的各类结构与病变,在影像上生成标注,医生可以快速浏览和确认。
自动检测与标注
- :对检测到的病变区域生成诊断提示,帮助低年资医生提升诊断水平。
辅助诊断提示
- :模型不受疲劳影响,可以检测到容易被人眼忽略的细微病变。
减少漏诊
- :标准化的检测流程确保诊断结果的一致性和可重复性。
诊断一致性
6.2 口腔医学教学
在口腔医学教学中,该数据集可用于:
- :帮助学生识别牙科影像中的各种结构和病变。
结构识别训练
- :基于数据集构建教学病例库,支持案例式教学。
病例库构建
- :用于学生影像识别能力的客观评估。
考核评估
6.3 医学影像AI研究
该数据集是牙科影像AI研究的理想平台:
- :31类的高类别数对算法提出了极高要求。
多类别检测算法研究
- :早期龋坏、微小骨缺损等小目标检测。
小目标检测研究
- :跨设备、跨机构的影像适应性研究。
领域适应研究
- :利用大量未标注数据提升模型性能。
半监督与弱监督学习
6.4 医疗AI产品研发
适用于牙科影像AI产品开发,包括:智能阅片系统、自动病变检测系统、数字化牙科诊断平台、口腔健康评估工具等。
6.5 算法对比实验
研究人员可利用该数据集对不同目标检测模型进行性能对比,例如:YOLOv8 / YOLOv9 / YOLOv10、Faster R-CNN、RT-DETR、DETR系列等。
七、进阶优化策略
7.1 小目标检测优化
龋坏、骨缺损等目标可能非常小,优化方向包括:提高输入分辨率、在大特征图上增加检测头、引入注意力机制增强小目标感知。
7.2 类别不平衡处理
31类数据中各类样本数可能差异显著:统计各类别样本分布,对少数类增加数据增强,在损失函数中设置类别权重,采用Focal Loss聚焦难分类样本。
7.3 多任务学习
结合检测与其他任务:检测+分割(精确定位病变边界)、检测+分类(识别病变严重程度)、检测+计数(统计牙齿数量和缺失数量)。
7.4 跨域适应
不同设备采集的影像可能存在域差异:可采用域自适应方法、风格迁移数据增强、混合域训练策略。

八、医疗AI合规与伦理考量
8.1 数据隐私保护
- 数据脱敏处理,去除患者身份信息
- 遵守相关医疗数据管理法规
- 数据存储和传输加密
8.2 AI辅助诊断的定位
- AI定位为辅助工具,最终诊断由医生确认
- 检测结果应标注置信度,便于医生评估
- 系统应提供可解释性信息
8.3 临床验证
- 模型上线前需经过充分的临床验证
- 建立持续监控机制,跟踪模型在实际使用中的表现
- 定期更新模型,适应数据分布变化
九、总结
本31类常见牙科结构与病变目标检测数据集通过丰富的类别体系与高质量标注,为牙科影像目标检测任务提供了可靠的数据支持。核心特点如下:
- :25000 张影像数据,满足深度学习模型训练需求。
数据规模大
- :31类覆盖牙体牙髓、牙周、修复、种植、正畸等多个专科。
类别体系完整
- :专业团队标注,多轮审核,确保准确性。
标注质量高
- :YOLO标准格式,适配主流模型。
格式标准化
- :可直接服务于牙科智能诊断系统开发。
应用价值高
随着人工智能技术在医疗领域的不断发展,牙科影像分析正逐渐迈向智能化与自动化。该数据集为口腔医学AI研究提供了重要的数据基础,未来随着更多医学数据与先进算法的结合,人工智能将在口腔医学领域发挥越来越重要的作用。