摘要:为应对24小时全时段视频监控需求, 行人重识别任务必须要同时应对单模态与跨模态重识别的挑战, 但目前的行人重识别任务通常将单模态与跨模态作为两个分支独立研究, 忽视了这两个任务互补的应用价值. 为应对这一挑战, 提出一种可协同训练单模态和跨模态行人数据集的可迁移网络架构, 通过三路分支网络深入挖掘每个模态的行人信息, 并深入探讨协同优化架构中的域间隙和模态样本量不平衡问题, 有效实现多任务的优化问题. 针对域间隙的问题提出一种低层级特征拉近策略, 显著减少了跨域样本特征间的差异, 使得模型能够学习并提取域不变的语义特征. 同时, 为了解决模态样本量不平衡的问题, 设计一种弱模态特征挖掘策略, 通过灵活调整训练权重, 使模型更加关注弱模态的优化. 实验结果表明, 所提出的框架可以迁移到使用ResNet作为主干网络的众多主流方法上, 其中在经典方法AGW的基础上Rank1和mAP分别提高了23.79 %和17.78 %.