欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 文旅 > 八卦 > YOLO系列论文综述(从YOLOv1到YOLOv11)【第12篇:YOLOv9——可编程梯度信息(PGI)+广义高效层聚合网络(GELAN)】

YOLO系列论文综述(从YOLOv1到YOLOv11)【第12篇:YOLOv9——可编程梯度信息(PGI)+广义高效层聚合网络(GELAN)】

2025/2/25 17:22:58 来源:https://blog.csdn.net/sinat_16020825/article/details/144160877  浏览:    关键词:YOLO系列论文综述(从YOLOv1到YOLOv11)【第12篇:YOLOv9——可编程梯度信息(PGI)+广义高效层聚合网络(GELAN)】

YOLOv9

  • 1 摘要
  • 2 改进点
  • 3 网络架构


YOLO系列博文:

  1. 【第1篇:概述物体检测算法发展史、YOLO应用领域、评价指标和NMS】
  2. 【第2篇:YOLO系列论文、代码和主要优缺点汇总】
  3. 【第3篇:YOLOv1——YOLO的开山之作】
  4. 【第4篇:YOLOv2——更好、更快、更强】
  5. 【第5篇:YOLOv3——多尺度预测】
  6. 【第6篇:YOLOv4——最优速度和精度】
  7. 【第7篇:YOLOv5——使用Pytorch框架、AutoAnchor、多尺度预训练模型】
  8. 【第8篇:YOLOv6——更高的并行度、引入量化和蒸馏以提高性能加速推理】
  9. 【第9篇:YOLOv7——跨尺度特征融合】
  10. 【第10篇:YOLOv8——集成检测、分割和跟踪能力】
  11. 【第11篇:YOLO变体——YOLO+Transformers、DAMO、PP、NAS】
  12. 【第12篇:YOLOv9——可编程梯度信息(PGI)+广义高效层聚合网络(GELAN)】
  13. 【第13篇:YOLOv10——实时端到端物体检测】
  14. 【第14篇:YOLOv11——在速度和准确性方面具有无与伦比的性能】
  15. 【第15篇(完结):讨论和未来展望】

1 摘要

  • 发布日期:2024年2月
  • 作者/贡献者:WongKinYiu等
  • 论文:YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
  • 代码:https://github.com/WongKinYiu/yolov9
  • 主要优缺点
    • 可编程梯度信息(PGI)+广义高效层聚合网络(GELAN);
    • 与YOLOv8相比,其出色的设计使深度模型的参数数量减少了49%,计算量减少了43%,但在MS COCO数据集上仍有0.6%的AP改进。

2 改进点

YOLOv9于2024年2月发布,代表了主流YOLO变体的最新进展。YOLOv9拥有两项关键创新:可编程梯度信息(PGI)框架和通用高效层聚合网络(GELAN)。

  • 可编程梯度信息(PGI)框架 旨在解决深层神经网络中固有的信息瓶颈问题,并使深度监督机制能够与轻量级架构兼容。通过实施PGI,无论是轻量级还是深层架构都能在准确性上获得显著提升,因为PGI确保了训练过程中可靠的梯度信息,从而增强了架构的学习能力和做出准确预测的能力。

  • 通用高效层聚合网络(GELAN) 架构特别设计用于通过高效率和轻量化来提升目标检测任务的性能。GELAN在不同的计算块和深度配置下表现出高性能,使其适合部署在各种推理设备上,包括资源受限的边缘设备。

通过结合上述两个框架(PGI和GELAN),YOLOv9在轻量级目标检测方面取得了显著的进步。

尽管YOLOv9仍处于早期阶段,但它已经在目标检测任务中展现了极强的竞争力,在参数减少和计算效率方面超越了YOLOv8,同时在MS COCO数据集上的平均精度(AP)提高了0.6%。

3 网络架构

下图展示了YOLOv9的网络架构图。

网络架构

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词