BSPDet:基于尺度和形状感知
遥感影像目标检测方法

程传祥 · 金飞 · 左溪冰 · 林雨准 · 王淑香 · 刘潇

研究背景

遥感影像目标检测是遥感影像智能解译的关键技术,旨在自动搜索并定位影像中的感兴趣目标。尽管通用目标检测算法在自然影像上已取得显著进展,但由于遥感影像固有的背景复杂、目标尺度与形状变化剧烈等特性,其直接应用于遥感领域时性能受限。

核心挑战

多尺度目标、复杂背景、极端长宽比

创新方案

BSPDet尺度和形状感知检测网络

核心指标

96.5%
RSOD mAP
73.7%
DIOR mAP
98.7%
SSDD mAP

遥感影像目标检测三大挑战

多尺度目标

尺寸变化剧烈
不同类别天然尺寸差异
相同类别尺寸变化大
单层感受野覆盖有限

复杂背景

背景噪声干扰
目标占影像面积小
大部分为复杂背景
背景弱化目标特征

极端长宽比

形状变化剧烈
桥梁等目标长度远大于宽度
卷积核感受野固定正方形
无法聚焦极端长宽比目标

BSPDet网络架构设计

GLCCFNet

全局局部交叉融合

Global-Local Contexts Crossing Fusion Network作为主干网络,实现尺度感知

多尺度特征提取

有效捕获多尺度目标的深层特征,充分考虑空间和通道互补性

MSDC模块

多尺度堆叠空洞卷积模块实现大范围上下文信息建模

SFFPN

可挑选焦点融合

Select-Focus Feature Pyramid Network通过语义精炼与空间选择过滤背景噪声

语义平衡机制

消除不同尺度特征图之间的语义鸿沟,实现语义平衡

空间选择性

自适应分配注意力权重,增强目标定位关键特征

SSDHead

形状感知解耦

Shape-aware Decoupled Head结合条带卷积和可变形卷积,实现形状感知

极端长宽比适应

专门针对极端长宽比目标设计,提升特征提取能力

条带+可变形卷积

充分结合条带卷积和可变形卷积的优势

三大核心技术创新

尺度感知机制

交叉融合策略

全局上下文提供空间权重
局部上下文提供通道注意力
充分考虑空间通道互补性

多尺度建模

MSDC模块通过堆叠空洞卷积实现大范围上下文信息近似建模

背景抑制机制

语义平衡

消除非相邻特征图语义鸿沟
平衡不同尺度特征语义差异
提升特征融合效果

空间选择

为不同尺度特征图分配不同空间权重,精准过滤复杂背景噪声

形状感知机制

双重卷积融合

条带卷积处理规则长宽比
可变形卷积适应任意形状
充分结合两者优势

解耦检测头

专门设计的解耦检测头提升极端长宽比目标的检测精度

多数据集实验结果

光学遥感数据集

RSOD数据集 96.5% mAP

遥感目标检测基准数据集表现优异

DIOR数据集 73.7% mAP

大规模光学遥感影像数据集验证

HRRSD数据集 94.4% mAP

高分辨率遥感舰船检测数据集

SAR数据集验证

SSDD数据集 98.7% mAP

SAR舰船检测数据集达到最优性能

泛化能力验证

超越LWM-YOLO等最新方法
超越DEPDet等先进算法
展现优越性能和泛化能力

对比基准

PKINet
YOLOv12
MobileNetv4
StarNet

性能优势总结

尺度感知
多尺度目标精准检测
背景抑制
复杂背景噪声过滤
形状感知
极端长宽比目标检测

实际应用场景

道路病害识别

自动检测路面裂缝、坑洞等病害,为道路维护提供技术支撑

舰船监测

海上舰船目标检测与跟踪,支持海洋监管和安全防护

应急救援

灾害现场目标快速识别,为应急救援决策提供信息支持

滑坡检测

地质灾害隐患点识别,预防和减少地质灾害损失

遥感影像目标检测的智能化突破

BSPDet引领尺度和形状感知的遥感目标检测新范式

尺度感知创新

GLCCFNet全局局部交叉融合网络,充分考虑空间通道互补性,实现多尺度目标精准检测

背景抑制机制

SFFPN可挑选焦点特征融合网络,通过语义平衡和空间选择精准过滤复杂背景噪声

形状感知设计

SSDHead形状感知解耦检测头,结合条带和可变形卷积,专门处理极端长宽比目标

技术贡献与应用价值

核心贡献

  • 提出BSPDet尺度形状感知网络
  • 设计GLCCFNet交叉融合主干
  • 创新SFFPN背景抑制机制

应用前景

  • 道路病害智能识别
  • 海上舰船监测
  • 应急救援支撑