基于YOLOv11肺结节检测系统 医学图像诊断识别
基于YOLOv11m_GAM_Attention的肺结节检测系统
这篇文章详细介绍一个基于改进YOLOv11的肺结节检测系统——从项目结构、功能特点到部署运行,再到模型本身的性能对比和架构创新,都会逐一展开。如果你正在做医学影像检测相关的工作,或者对YOLO系列模型的注意力机制优化感兴趣,这里有不少实在的参考。
项目结构
本项目在Ultralytics官方代码的基础上做了适配和扩展,完整的目录结构如下:

功能特点
系统围绕CT图像中的肺结节检测设计,核心功能覆盖了从输入到输出的完整链路:支持PNG、JPG、JPEG格式的肺部CT图像上传;检测环节使用YOLOv11m_GAM_Attention模型,输出带有目标框、类别和置信度的可视化结果;同时实时统计检测耗时和目标数量。在数据输出方面,不仅提供每个目标的位置坐标(xmin, ymin, xmax, ymax)、类别和置信度详情,还可以一键导出CSV格式的检测报告,方便后续分析或存档。
安装与运行
环境部署步骤:
整个部署过程很清晰,几步就能搞定:
- 安装依赖:
- 文件准备:将GAMA_YOLO11m模型权重放到项目根目录,中文字体放入
static/fonts/目录。 - 创建必要目录:
- 启动服务:
- 访问系统:
使用说明
打开系统后,通过主页的“选择文件”按钮上传CT图像,系统会自动处理并显示检测结果。在结果页上可以用目标选择器切换查看不同类别的检测情况,底部有详细的检测数据表格。需要保存结果时,点击“保存”按钮即可导出CSV报告;任务完成后,点击“退出”安全关闭系统。
YOLOv11m_GAM_Attention模型
性能对比表:
下面这张表把改进模型和基准模型放在一起做了对比,可以直观看到GAM注意力机制带来的提升:
模型架构创新:
这个模型的核心改动在于引入了GAM(Global Attention Mechanism)模块,专门针对肺结节检测任务做了优化。注意力机制分两个子模块:通道注意力采用3D排列加双层MLP结构,空间注意力则基于卷积做空间信息融合。设计上避免了最大池化操作以减少信息损失,同时用分组卷积和通道混洗来控制参数增长。模块被集成在P3、P4、P5三个特征层上,效果很直接——对小目标的检测灵敏度明显提升,相比基准YOLOv11m,mAP50提高了3.4个百分点,达到0.888。参数量和计算量虽有增加(从20M到23.9M,FLOPs从67.6B到80.2B),但在实际检测精度上的收益是值得的。