基于特征增强和历史帧选择的Transformer视觉跟踪算法
CSTR:
作者:
作者单位:

1. 西安邮电大学 计算机学院,西安 710121;2. 西安邮电大学 陕西省网络数据分析与 智能处理重点实验室,西安 710121;3. 空军工程大学 信息与导航学院,西安 710100

作者简介:

通讯作者:

E-mail: hzq@xupt.edu.cn.

中图分类号:

TP391.4

基金项目:

国家自然科学基金项目(62072370);陕西省自然科学基金项目(2023-JC-YB-598).


Feature enhancement and history frame selection based Transformer visual tracking
Author:
Affiliation:

1. School of Computer,Xián University of Posts & Telecommunications,Xián 710121,China;2. Shaanxi Key Laboratory of Network Data Analysis and Intelligent Processing,Xián University of Posts & Telecommunications,Xián 710121,China;3. School of Information & Navigation,Air Force Engineering University,Xián 710100,China

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    为进一步提升跟踪算法在历史帧信息利用和目标特征表达方面的性能,提出基于特征增强和历史帧选择的Transformer视觉跟踪算法(feature enhancement and history frame selection based Transformer visual tracking,FEHST).首先,在骨干网络中引入动态预测模块,通过稀疏化策略提高自注意力机制的计算效率,聚焦目标区域特征;其次,提出特征增强模块,将局部信息与全局信息的优势相结合,提升特征的表达能力;最后,采用自适应历史帧选择策略,提升跟踪器对目标动态信息的关注.在LaSOT、TrackingNet、GOT-10K和OTB100等数据集上进行了大量的实验,实验结果显示,在LaSOT、TrackingNet、OTB100上分别取得70.1%、83.0%和71.6%的成功率,在GOT-10K上取得71.4%的平均重叠度,并能以27FPS的速度运行.

    Abstract:

    To enhance the performance of tracking algorithms in utilizing historical frame information and articulating target features, this paper proposes the feature enhancement and history frame selection based Transformer visual tracking(FEHST) algorithm. Firstly, a dynamic prediction module is integrated into the backbone network with a sparsification strategy to enhance the self-attention mechanism's computational efficiency, focusing on the target region's features. Then, a feature enhancement module is introduced, merging local and global information to improve feature representation. Finally, an adaptive history frame selection strategy is adopted to enhance focus on target dynamics and algorithm robustness. Experiments on LaSOT, TrackingNet, GOT-10K, and OTB100 datasets are carried out to validate the algorithm, showing success rates of 70.1%, 83.0%, and 71.6%, and a 71.4% average overlap on GOT-10K, at 27 FPS.

    参考文献
    相似文献
    引证文献
引用本文

侯志强,杨晓麟,马素刚,等.基于特征增强和历史帧选择的Transformer视觉跟踪算法[J].控制与决策,2024,39(10):3506-3512

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2024-08-29
  • 出版日期: 2024-10-20
文章二维码