基于投影注意力高程注意力
机载LiDAR点云语义分割

李龙威 · 刘晓栋 · 陈辉 · 杨礼平 · 赵立科 · 张卡

研究背景

机载LiDAR点云语义分割是实现三维场景理解的重要环节。现有方法存在局限性:基于局部聚合的方法难以捕捉长距离依赖;Transformer虽能扩大感受野但计算成本高昂;多数方法未充分利用机载数据中的丰富高程信息。

技术挑战

长距离依赖建模与高程信息利用不足

创新方案

PE-Net融合投影注意力与高程注意力机制

核心指标

82.6%
ISPRS OA分数
97.0%
GML OA分数
20.4%
F1分数提升

PE-Net网络架构

投影注意力模块

核心创新

将传统自注意力中的键和值投影至低秩子空间,以线性计算复杂度捕捉长距离关系

技术优势

有效克服标准Transformer的性能瓶颈,实现高效全局依赖建模

数学表达

Attention = softmax(QKT/√dk)V

高程注意力模块

设计理念

直接从点的Z坐标学习注意力权重,显式增强模型对地形变化的敏感度

应用价值

充分利用机载数据垂直结构先验知识,提升复杂地形场景分割精度

计算流程

hj = ReLU(BN(Wjhj-1 + bj))

三大核心技术创新

投影注意力

Projection Attention
低秩子空间投影
线性计算复杂度
长距离依赖建模

高程注意力

Elevation Attention
Z坐标直接学习
地形变化敏感
垂直结构先验

特征增强

Feature Enhancement
多尺度上下文聚合
局部全局深度融合
复杂结构表达

局部-全局特征增强模块

模块设计

并行池化操作

最大池化
突出显著特征
平均池化
保持整体信息

多尺度聚合

通过并行操作聚合多尺度上下文信息,实现局部几何细节与全局语义的深度融合

技术优势

主动式融合

相比传统跳跃连接的被动拼接,实现有选择性的特征交互增强

复杂场景适应

有效处理大尺度建筑群和小尺度电力线等复杂空间结构

边界精度提升

显著改善分割边界的精确性和一致性

实验结果与性能评估

数据集性能

ISPRS Vaihingen3D 主流基准
82.6%
OA分数
72.1%
Avg.F1
GML数据集 复杂场景
97.0%
OA分数
72.8%
Avg.F1
LASDU数据集 优秀表现

展现出较优的分割结果和泛化能力

与基线对比

相比KPConv基线

+7.0%
OA分数提升
+20.4%
F1分数提升

核心优势

  • 显著提升整体精度
  • 优秀的泛化性能
  • 复杂场景鲁棒性

计算效率

投影注意力机制实现线性计算复杂度,适用于大规模机载LiDAR数据处理

机载LiDAR点云处理的技术突破

融合投影注意力与高程注意力的深度学习创新方案

投影注意力创新

通过低秩子空间投影实现线性复杂度的全局依赖建模,突破传统Transformer计算瓶颈

高程注意力机制

直接从Z坐标学习注意力权重,充分利用机载数据垂直结构先验知识

特征深度融合

局部-全局特征增强模块实现多尺度上下文信息的主动式融合

技术贡献与应用前景

核心贡献

  • 提出PE-Net网络架构
  • 创新投影注意力机制
  • 设计高程注意力模块

应用前景

  • 城市三维建模
  • 林业资源调查
  • 环境监测分析