研究背景
机载LiDAR点云语义分割是实现三维场景理解的重要环节。现有方法存在局限性:基于局部聚合的方法难以捕捉长距离依赖;Transformer虽能扩大感受野但计算成本高昂;多数方法未充分利用机载数据中的丰富高程信息。
技术挑战
长距离依赖建模与高程信息利用不足
创新方案
PE-Net融合投影注意力与高程注意力机制
核心指标
82.6%
ISPRS OA分数
97.0%
GML OA分数
20.4%
F1分数提升
PE-Net网络架构
投影注意力模块
核心创新
将传统自注意力中的键和值投影至低秩子空间,以线性计算复杂度捕捉长距离关系
技术优势
有效克服标准Transformer的性能瓶颈,实现高效全局依赖建模
数学表达
Attention = softmax(QKT/√dk)V
高程注意力模块
设计理念
直接从点的Z坐标学习注意力权重,显式增强模型对地形变化的敏感度
应用价值
充分利用机载数据垂直结构先验知识,提升复杂地形场景分割精度
计算流程
hj = ReLU(BN(Wjhj-1 + bj))
三大核心技术创新
投影注意力
Projection Attention
低秩子空间投影
线性计算复杂度
长距离依赖建模
高程注意力
Elevation Attention
Z坐标直接学习
地形变化敏感
垂直结构先验
特征增强
Feature Enhancement
多尺度上下文聚合
局部全局深度融合
复杂结构表达
局部-全局特征增强模块
模块设计
并行池化操作
最大池化
突出显著特征
平均池化
保持整体信息
多尺度聚合
通过并行操作聚合多尺度上下文信息,实现局部几何细节与全局语义的深度融合
技术优势
主动式融合
相比传统跳跃连接的被动拼接,实现有选择性的特征交互增强
复杂场景适应
有效处理大尺度建筑群和小尺度电力线等复杂空间结构
边界精度提升
显著改善分割边界的精确性和一致性
实验结果与性能评估
数据集性能
ISPRS Vaihingen3D
主流基准
82.6%
OA分数
72.1%
Avg.F1
GML数据集
复杂场景
97.0%
OA分数
72.8%
Avg.F1
LASDU数据集
优秀表现
展现出较优的分割结果和泛化能力
与基线对比
相比KPConv基线
+7.0%
OA分数提升
+20.4%
F1分数提升
核心优势
- 显著提升整体精度
- 优秀的泛化性能
- 复杂场景鲁棒性
计算效率
投影注意力机制实现线性计算复杂度,适用于大规模机载LiDAR数据处理