建筑物作为城乡区域占主体地位的地物目标,精确的建筑物分布信息对于监测城市地区的变化、城市规划和人口估计等科学研究具有重要意义。遥感技术具有监测范围大、获取速度快等特点,因此越来越多的研究者使用遥感影像作为数据源提取建筑物空间分布信息。遥感图像建筑物的分割常受到复杂场景中道路、树木及建筑物之间距离等因素的影响,建筑物的分割边界容易与其他物体边界融合使得难以提取并精确分割。
针对上述挑战,西安建筑科技大学徐胜军副教授团队提出了一种融合分形几何特征Resnet 遥感图像建筑物分割方法,所提方法结合分形(名词解释)能够有效描述图像几何特征的特点,利用分形维数(名词解释)描述图像像素邻域空间灰度分布(名词解释),建立遥感图像中不同物体的分形特征先验知识,并结合注意力机制(名词解释),提出了一种融合分形特征的 Resnet 网络模型用于遥感图像建筑物分割,该方法提升了建筑物和复杂背景边界的分割精度。
图1 网络整体结构示意图
该方法整体结构包括编码(名词解释)和解码(名词解释)两大部分。编码部分以Resnet101为主干网络捕获遥感图像特征,通过在每个残差层后引入提出的融合分形先验的空洞空间金字塔池化模块(Fractal Dimension in Atrous Spatial Pyramid Pooling,FD-ASPP),利用遥感图像不同对象的分形先验知识增强网络对不同遥感物体图像特征的辨别能力。解码部分设置了多次上采样,可以将遥感图像特征图的分辨率还原为输入图像大小。每次上采样之后,高层次特征图(网络的上采样层)跳跃连接相同尺寸的低层次特征图,使用深度可分离卷积注意力机制(Deeply separable convolution attention fusion,DSCAF)进行特征融合。经过融合的特征图,保留了更深层次的语义信息。最后通过输出层将特征图的像素进行二分类,获得分割结果。
图2融合分形先验的空间金字塔池化模块
FD-ASPP模块通过多尺度空洞卷积扩大感受野(名词解释)的方式,融合不同尺度的特征信息提升模型对细节特征的表达能力;同时通过引入分形特征增强了网络对遥感图像不同对象的几何特征描述能力,不仅能抑制建筑物附近的道路、树木、阴影等因素的干扰,而且为遥感图像建筑物的分割提供了更具辨别力的几何特征信息。
深度可分离卷积注意力融合机制(Deeply separable convolution attention fusion,DSCAF)通过利用高层次特征图的注意力信息,指导低层次特征图与高层次特征图的融合,该融合机制利用深度可分离卷积操作替代全局平均池化(名词解释),在实现了全局池化功能的同时赋予了特征图每个位置可学习的权重。
提出的方法不仅有效克服了道路、树木、阴影等因素的干扰,具有更好的建筑物分割效果,而且得到了较清晰的建筑物边界。
文章信息:
徐胜军,张若暄,孟月波等.融合分形几何特征Resnet遥感图像建筑物分割[J].光学精密工程,2022,30(16):2006-2020.
XU Shengjun,ZHANG Ruoxuan,MENG Yuebo,et al.Fusion of fractal geometric features Resnet remote sensing image building segmentation[J].Optics and Precision Engineering,2022,30(16):2006-2020.
https://ope.lightpublishing.cn/thesisDetails#10.37188/OPE.20223016.2006