资料内容:
2.1 表征能力更强的 RepBi-PAN Neck 网络
有效的多尺度特征融合网络对目标检测的效果尤为关键。特征金字塔网络 (FPN) 通过
自上而下的路径来融合来自骨干网络不同 Stage 的输出特征以弥补网络学习过程中目
标位置信息的损失。鉴于单向信息流传输的局限性,PANet 在 FPN 之上添加了一个额
外的自底向上路径。 BiFPN 为不同的输入特征引入了可学习的权重,并简化了 PAN
以实现更好的性能和更高的效率。PRB-FPN 通过具有双向融合的并行残差 FPN 结构
来保留高质量的特征,以进行准确定位。
受到上述工作的启发,我们提出了一个表征能力更强的可重参化双向融合 PAN
(RepBi-PAN)Neck 网络。一般而言,骨干网络浅层特征分辨率高,具有丰富的空间
信息,有利于目标检测中的定位任务。为了聚合浅层特征,常见的做法是在 FPN 中增
加 P2 融合层以及一个额外的检测头,但这往往会带来较大的计算成本。
为了实现更好的精度和时延权衡,我们设计了一个双向联结(Birectional Concate
nate, BiC)模块,在自上而下的传输路径中引入自底向上的信息流,使得浅层特征能
以更高效的方式参与多尺度特征融合,进一步增强融合特征的表达能力。此模块能够帮
助保留更准确的定位信号,这对于小物体的定位具有重要意义。
此外,我们对上一版本的 SimSPPF 模块进行了特征增强优化,以丰富特征图的表示
能力。我们发现 YOLOv7 使用的 SPPCSPC 模块能够提升检测精度,但对网络推理
速度的影响较大。于是我们对其进行了简化设计,在检测精度影响不大的情况下,大大
提升了推理效率。同时,我们引入了可重参数化思想并对 Neck 网络的通道宽度和深度
进行了相应的调整。最终 RepBi-PAN 网络结构如下图 2 所示: