欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 新闻 > 国际 > 【深度学习基础之多尺度特征提取】特征金字塔(Feature Pyramid)是如何在深度学习网络中提取多尺度特征的?附代码

【深度学习基础之多尺度特征提取】特征金字塔(Feature Pyramid)是如何在深度学习网络中提取多尺度特征的?附代码

2025/1/2 20:41:46 来源:https://blog.csdn.net/gaoxiaoxiao1209/article/details/144492602  浏览:    关键词:【深度学习基础之多尺度特征提取】特征金字塔(Feature Pyramid)是如何在深度学习网络中提取多尺度特征的?附代码

【深度学习基础之多尺度特征提取】特征金字塔(Feature Pyramid)是如何在深度学习网络中提取多尺度特征的?附代码

【深度学习基础之多尺度特征提取】特征金字塔(Feature Pyramid)是如何在深度学习网络中提取多尺度特征的?附代码


文章目录

  • 【深度学习基础之多尺度特征提取】特征金字塔(Feature Pyramid)是如何在深度学习网络中提取多尺度特征的?附代码
  • 前言
    • 1. 特征金字塔(Feature Pyramid)的工作原理
    • 2. FPN的架构
    • 3. 代码实现:FPN(Feature Pyramid Networks)
      • 代码解析:
        • 底到顶路径(Bottom-up pathway):
        • 顶到底路径(Top-down pathway):
        • 特征融合:
        • 输出:
    • 4. 特征金字塔在深度学习中的作用
    • 5. 总结


欢迎宝子们点赞、关注、收藏!欢迎宝子们批评指正!
祝所有的硕博生都能遇到好的导师!好的审稿人!好的同门!顺利毕业!

大多数高校硕博生毕业要求需要参加学术会议,发表EI或者SCI检索的学术论文会议论文:
可访问艾思科蓝官网,浏览即将召开的学术会议列表。会议详细信息可参考:https://ais.cn/u/mmmiUz

前言

特征金字塔(Feature Pyramid) 是一种用于提取多尺度特征的技术,常用于目标检测和图像分割等任务中。特征金字塔通过逐层下采样并融合不同尺度的特征图,帮助网络在不同层次上捕获不同尺度的上下文信息。

最经典的特征金字塔结构是 FPN (Feature Pyramid Networks),它通过顶到底(top-down)和底到顶(bottom-up)两种路径,将多尺度特征进行有效融合,进而提升模型对不同大小目标的识别能力。

1. 特征金字塔(Feature Pyramid)的工作原理

FPN 的基本思想是将高层特征(低分辨率、高语义信息)与低层特征(高分辨率、细节信息)结合,构建出一个多尺度的特征金字塔。

  • 底到顶路径(Bottom-Up Pathway):从输入图像中提取逐渐低分辨率的特征图(如通过卷积层进行下采样)。
  • 顶到底路径(Top-Down Pathway):通过反卷积(或上采样)将高层特征图上采样到较高分辨率,并与相应分辨率的低层特征图进行融合。

通过这种方式,FPN可以将高层特征的语义信息与低层特征的细节信息结合起来,从而提升对小物体和大物体的检测能力。

2. FPN的架构

FPN通常包含以下几个组件:

  • 底到顶路径:使用卷积网络逐步提取不同尺度的特征图。
  • 顶到底路径:使用上采样(如转置卷积或插值)将高层特征图恢复到较高分辨率,并与低层特征进行融合(通常通过加法或拼接的方式)。
  • 特征融合:最终通过卷积将融合后的多尺度特征整合,输出最终的多尺度特征图。

3. 代码实现:FPN(Feature Pyramid Networks)

以下是一个简化版的 FPN(Feature Pyramid Network)实现,展示了如何通过顶到底路径和底到顶路径进行特征融合:

简化版FPN的代码示例:

import torch
import torch.nn as nn
import torch.nn.functional as Fclass FPN(nn.Module):def __init__(self, in_channels, out_channels):super(FPN, self).__init__()# Bottom-up layers (convolutions with downsampling)self.conv1 = nn.Conv2d(in_channels, out_channels, kernel_size=3, stride=2, padding=1)self.conv2 = nn.Conv2d(out_channels, out_channels, kernel_size=3, stride=2, padding=1)self.conv3 = nn.Conv2d(out_channels, out_channels, kernel_size=3, stride=2, padding=1)# Top-down layers (Upsampling and combining features)self.upsample2 = nn.ConvTranspose2d(out_channels, out_channels, kernel_size=2, stride=2)self.upsample3 = nn.ConvTranspose2d(out_channels, out_channels, kernel_size=2, stride=2)# Final convolution to refine the output feature mapself.final_conv = nn.Conv2d(out_channels * 3, out_channels, kernel_size=3, padding=1)def forward(self, x):# Bottom-up feature extractionx1 = self.conv1(x)  # First downsampling layerx2 = self.conv2(x1)  # Second downsampling layerx3 = self.conv3(x2)  # Third downsampling layer# Top-down feature refinementx2_up = self.upsample2(x3)  # Upsample x3 to match x2x2_fuse = x2 + x2_up  # Combine x2 and x2_upx1_up = self.upsample3(x2_fuse)  # Upsample x2_fuse to match x1x1_fuse = x1 + x1_up  # Combine x1 and x1_up# Final feature map after fusion of multi-scale featuresout = self.final_conv(torch.cat([x1_fuse, x2_fuse, x3], dim=1))return out# 示例输入
input_tensor = torch.randn(1, 3, 64, 64)  # 输入一个64x64的RGB图像
model = FPN(in_channels=3, out_channels=16)
output_tensor = model(input_tensor)
print(output_tensor.shape)  # 输出形状: (1, 16, 64, 64)

代码解析:

底到顶路径(Bottom-up pathway):
  • 使用3个卷积层(conv1, conv2, conv3)依次对输入特征图进行下采样(通过卷积+步长=2的方式)。
  • 每一层卷积提取一个不同尺度的特征图,其中 x1, x2, x3 分别代表从较低分辨率到较高分辨率的特征。
顶到底路径(Top-down pathway):
  • 使用上采样(ConvTranspose2d,即转置卷积)将高层特征图上采样。
  • x2_upx1_up 是分别上采样 x3x2 到较高分辨率后得到的特征图。
  • 将上采样后的特征图与底层特征图进行融合(通过加法)x2_fusex1_fuse
特征融合:
  • 将不同尺度的特征图 x1_fuse, x2_fuse, x3 拼接起来,并通过一个最终的卷积层(final_conv)来精细化多尺度特征。
输出:
  • 最终输出的特征图包含了多个尺度的信息。

4. 特征金字塔在深度学习中的作用

  • 多尺度特征提取:通过在不同层次提取特征并融合,FPN帮助网络捕获不同尺度的物体信息。低层特征图包含了更细粒度的空间信息,而高层特征图包含了更丰富的语义信息。
  • 小物体检测:由于低层特征图包含了较多细节,帮助模型识别较小的目标。
  • 大物体检测:高层特征图提供了丰富的上下文信息,有助于识别大尺寸的物体。

5. 总结

  • 特征金字塔(FPN)通过底到顶和顶到底的特征融合路径,结合不同层的多尺度特征,有效提升了深度学习模型对多尺度物体的识别能力。
  • 在许多任务中,如目标检测和图像分割,FPN技术都表现出了显著的优势,特别是在同时处理小物体和大物体时。通过逐层下采样和上采样的方式,FPN实现了高效的多尺度特征融合,显著提升了模型的性能。

欢迎宝子们点赞、关注、收藏!欢迎宝子们批评指正!
祝所有的硕博生都能遇到好的导师!好的审稿人!好的同门!顺利毕业!

大多数高校硕博生毕业要求需要参加学术会议,发表EI或者SCI检索的学术论文会议论文:
可访问艾思科蓝官网,浏览即将召开的学术会议列表。会议详细信息可参考:https://ais.cn/u/mmmiUz

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com