摘要:针对无人机城市街景实时语义分割任务中轻量级算法缺乏全局信息交互导致像素类别错分的问题, 提出一种注意力置换与通道重建的无人机城市街景实时语义分割网络, 网络采用编码-解码结构. 在编码器中, 利用轻量级的置换自注意力机制来构建注意力分支, 提取全局上下文信息的同时保持较高的计算效率; 利用分裂-变换-融合的策略设计通道重建模块对注意力分支的输入进行融合压缩, 减小无关特征带来的计算量和对分割结果的影响. 在解码器阶段, 利用空间权重加权构建空间特征融合模块, 实现对有效特征最大程度上的利用; 利用置换自注意力机制和非对称卷积构建全局信息感知模块, 以克服无人机航拍图像中复杂背景的干扰. 实验结果表明: 所提模型在UAVid验证集上平均交并比达到72.3 %, 相较于UNetFormer提升了 2.3%, 分割速度达到每秒105.8帧; 在保证模型分割速度的前提下, 取得了较好的分割精度.