欢迎来到尧图网

客户服务关于我们

您的位置：首页 > 健康 > 养生 > 论文阅读【检测】：Facebook ECCV2020 | DETR

论文阅读【检测】：Facebook ECCV2020 | DETR

2025/3/10 15:39:04 来源：https://blog.csdn.net/qq_17614495/article/details/140657032 浏览: 次关键词：论文阅读【检测】：Facebook ECCV2020 | DETR

文章目录

- 论文地址
- Abstract
- Motivation
- 模型框架
- 详细结构
- 小结

论文地址

DETR

Abstract

提出了一种将目标检测视为直接集预测问题的新方法。简化了检测pipeline，有效地消除了许多手工设计的组件的需求，例如非最大抑制过程或锚生成，这些组件明确地编码了任务的先验知识。新框架的主要成分，是基于集合的全局损失，它通过二部匹配强制唯一的预测，以及变transformer encoder-decoder架构。给定一组固定的学习对象查询，DETR 推理对象和全局图像上下文的关系，以并行直接输出最终的预测集。DETR在具有挑战性的COCO对象检测数据集上展示了与成熟和高度优化的Faster RCNN基线相当的准确性和运行时性能。

Motivation

通常检测器通过在proposal、anchor 或center point 上定义代理回归和分类问题，以间接方式解决该集合预测任务。它们的性能受到后处理步骤、锚集的设计以及将目标框分配给锚的启发式方法显着影响。为了简化这些pipeline，所以提出了一种直接集预测方法来绕过代理任务。

模型框架

从论文图中可以看出，整个pipeline确实很简单。
在这里插入图片描述

详细结构

图像先经过下采样，用小的feature map输入transformer结构中，必然导致了对小目标检测效果较差。论文中也明确说了这个问题。 初始化的queries为0, 同时position embedding 每个模块都要加一次
在这里插入图片描述
Encoder

Decoder

小结

确实简化都不少手工设计的组建，但是在小目标的表现上较差。NMS感觉还是需要的，不可能刚刚好一个目标对应预测一个框。

版权声明:

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

相关资讯

热文排行

最新新闻

推荐新闻

热搜词