• 2025年第40卷第6期文章目次
    全 选
    显示方式: |
    • >国家战略科技领域发展特邀综述
    • 鲁棒博弈动力学: 分析与综合

      2025, 40(6):1761-1773. DOI: 10.13195/j.kzyjc.2024.1292

      摘要 (1355) HTML (1859) PDF 119.11 K (853) 评论 (0) 收藏

      摘要:不确定性广泛存在于各种自然和工程系统中, 这对系统动力学的建模、分析、预测和控制提出巨大挑战. 对于工程控制系统, 已经发展出鲁棒控制相关理论以研究不确定性对系统动力学的影响及其综合设计问题. 然而, 对于大规模人在环路的集群自主系统, 不确定性下的系统动力学研究仍处于起步阶段. 鉴于此, 将经典控制系统中鲁棒控制的概念和方法扩展到大规模集群自主系统, 提出鲁棒博弈动力学的分析和综合方法, 针对类典型的不确定性研究了系统的演化动力学, 并结合经济学、心理学、社会学中的期望效用理论探讨博弈群体对不确定性的主观响应. 不确定性可以逆转经典博弈动力学的演化方向以及产生多稳态和周期振荡极限环等丰富的动力学行为, 所作研究揭示了不确定性对集群自主系统演化的重要影响以及群体博弈系统动力学的复杂性.

    • 基于工业视角的概念漂移检测与适应方法综述

      2025, 40(6):1774-1792. DOI: 10.13195/j.kzyjc.2024.1431

      摘要 (1267) HTML (1167) PDF 159.71 K (670) 评论 (0) 收藏

      摘要:智能工业化的迅速发展推动了技术设备的持续创新, 随之而来产生大量实时数据流. 在这些数据流中, 数据的统计特性随时间可能发生变化, 这一现象称为概念漂移. 概念漂移对机器学习模型的性能产生显著影响, 未能及时识别和应对会导致模型性能的逐步下降, 进而引发错误决策, 从而在工业应用中造成不可忽视的损失. 鉴于此, 从工业应用的角度出发, 总结目前概念漂移检测与适应的研究进展. 首先, 聚焦于有监督环境下的工业概念漂移检测方法, 从基于性能、窗口技术和集成方法角度详细总结相关技术的发展现状; 其次, 针对工业场景中常见的标签稀缺问题, 系统介绍半监督学习和无监督学习在工业概念漂移检测中的应用方法, 此外讨论工业环境中普遍存在的不平衡类问题对概念漂移检测的影响, 并综述解决这一问题的相关策略; 最后, 针对工业环境下的概念漂移适应方法进行总结, 并提出未来研究的方向, 以进一步提升概念漂移检测方法在复杂动态环境中的表现.

    • >综述与评论
    • 基于深度学习的红外与可见光图像融合综述: 发展与展望

      2025, 40(6):1793-1806. DOI: 10.13195/j.kzyjc.2024.1037

      摘要 (926) HTML (1992) PDF 197.96 K (658) 评论 (0) 收藏

      摘要:红外与可见光图像融合(IVIF)技术旨在整合热辐射传感器和光学传感器所捕获相同场景的图像中的互补信息, 生成一张更适合人类理解或计算机分析处理的融合图像. 随着深度学习的发展, 该技术在军事侦察、自动驾驶、安防监控等领域的作用愈发重要. 以往的综述只对相关文献进行了归纳总结, 鲜有从网络结构以及损失函数发展历程的角度进行详细分析, 且缺乏最新的研究进展和对比实验. 鉴于此, 针对基于深度学习的IVIF方法展开全面回顾和展望. 首先, 从发展历程的角度对基于深度学习的IVIF方法进行回顾, 介绍其网络结构和损失函数的演进过程; 然后, 总结IVIF中常见的数据集以及性能评价指标, 并讨论未来所发布数据集应具备的特征; 接着, 对18种具有代表性的方法在3个公开数据集上进行大量实验, 从主观和客观的角度分析不同方法的性能; 最后, 总结IVIF任务当前所面临的挑战, 并展望未来的研究方向.

    • >论文与报告
    • 基于笛卡尔空间力补偿的柔性关节协作机械臂轨迹跟踪控制

      2025, 40(6):1807-1816. DOI: 10.13195/j.kzyjc.2024.0808

      摘要 (327) HTML (704) PDF 104.09 K (684) 评论 (0) 收藏

      摘要:针对柔性关节机械臂控制精度低和轨迹跟踪控制动态性能差等问题, 提出一种笛卡尔空间力补偿的轨迹跟踪控制算法, 旨在提高笛卡尔空间轨迹跟踪精度. 首先, 介绍串联弹性执行器和六自由度机械臂系统模型, 并设计基于神经网络模型预测控制的关节空间位置-速度-力矩混合控制算法; 接着, 基于该关节控制器设计基于柔性关节机械臂的笛卡尔空间力补偿控制算法, 根据笛卡尔空间的跟踪误差并结合PID控制器计算笛卡尔空间中的力补偿值; 其次, 将其转换为关节力矩补偿值并补偿到关节控制器, 以实现高精度的笛卡尔空间轨迹跟踪, 笛卡尔空间力补偿能够有效地抵消外部干扰和系统不确定性, 减小系统的跟踪误差, 使机械臂能够更准确地跟踪目标轨迹; 最后, 通过仿真和实验验证了该控制器的有效性和优越性. 实验结果表明, 所设计的轨迹跟踪控制器整体精度为1.86 mm, 相较于无补偿的轨迹跟踪和基于位置补偿的轨迹跟踪控制算法, 精度分别提升了2.91 mm和1.77 mm.

    • 带收益和时间窗的多行程卡车-无人机协同配送问题

      2025, 40(6):1817-1826. DOI: 10.13195/j.kzyjc.2024.0852

      摘要 (201) HTML (317) PDF 136.62 K (429) 评论 (0) 收藏

      摘要:为了推动低空经济发展, 提高企业经济效益和“最后一公里”配送效率, 提出考虑客户收益和时间窗的多行程卡车-无人机协同配送问题. 首先, 以最大化利润为目标建立基础的混合整数规划模型(MIP), 并融入有效不等式来减少基础模型的松弛度. 然后, 提出一种高效的混合启发式算法求解该问题, 同时, 考虑到具有时间窗特征的卡车-无人机路径较为复杂, 可行性判断耗时高, 设计一种基于Segment的有效评估方法来加速路径的可行性检查, 以提高算法的求解效率. 实验结果表明: 有效不等式可将精确求解器 —— Gurobi求解模型的速度提高44 %; 其次, 在不同规模的算例中, 所提出混合启发式算法在求解效率和质量方面均优于Gurobi与两类启发式对比算法, 并表现出良好的稳定性; 此外, 通过嵌入Segment有效评估方法可减少算法95 %的求解时间.

    • 基于深度学习的公交客流检测算法

      2025, 40(6):1827-1837. DOI: 10.13195/j.kzyjc.2024.1245

      摘要 (229) HTML (390) PDF 86.54 K (408) 评论 (0) 收藏

      摘要:针对公交客流检测因忽略边缘计算而导致的数据处理延迟和准确性问题, 基于“云-边-端协同架构”提出一种实时且轻量级的公交客流检测算法BPF-DETR. 首先, 采用RT-DETR-r18作为基线算法来提高实时处理能力; 然后, 引入轻量级iRMB模块更新ResNet-18作为特征提取主干, 通过倒置残差结构充分学习乘客目标的长距离特征交互以及小目标的局部特征交互, 在提高轻量性和精度的同时增强算法的边缘适用性; 接着, 引入ASF架构中的SSFF模块和TFE模块构建多尺度特征融合模块MSFM, 以进一步提升所提出算法在多尺度和复杂环境下的检测精度; 最后, 为了验证所提出算法的有效性, 采用基于ROI的图像拼接方法, 以提高数据集的代表性和多样性, 构建公交客流监控数据集进行训练验证. 实验结果表明, BPF-DETR的mAP@0.5为96.4 %, 模型大小为32.6 MB, 均优于目前主流的YOLO系列模型, 相较于基线算法, mAP@0.5提升了1.1 %, 模型大小下降了16 %, 能够满足公交客流检测准确率以及边缘部署轻量化要求.

    • 约束环境下基于深度强化学习的协同路径规划研究

      2025, 40(6):1838-1846. DOI: 10.13195/j.kzyjc.2024.1019

      摘要 (301) HTML (419) PDF 75.26 K (335) 评论 (0) 收藏

      摘要:对于部分可观马尔可夫决策过程下的多智能体路径规划任务, 现有研究基于栅格或质点环境, 与真实物理环境有较大差距. 鉴于此, 研究如何在更加接近实际物理约束环境下提升多智能体协同路径规划的效果. 一方面, 在考虑真实物理约束的情况下, 根据执行器饱和以及欠驱动等构建多约束动作空间, 根据距离和位置等搭建多源输入状态空间, 设计抗冗余奖励函数来减小无人车行驶过程中动作冗余; 另一方面, 针对在Gazebo环境下训练难度高、效率低、难收敛等问题, 提出基于预训练-微调方法的多智能体双延迟深度确定性策略梯度算法, 利用预训练使得模型获得一个更优的初始值, 提升训练效率, 同时, 利用微调对预训练先验模型进行针对性优化, 增强模型训练过程抵抗环境非平稳性能力. 在Gazebo仿真环境中, 通过与PMATD3、MATD3、MADDPG等算法对比, 验证所提出算法的有效性.

    • 基于态势感知的无人机空战协同决策方法

      2025, 40(6):1847-1854. DOI: 10.13195/j.kzyjc.2024.0984

      摘要 (352) HTML (450) PDF 80.94 K (362) 评论 (0) 收藏

      摘要:针对智能空中博弈中无人机协同决策的问题展开研究. 鉴于空中博弈复杂性, 包括不确定性、信息不完备性和动态性等特点, 提出了一种强鲁棒性的无人机协同决策技术, 旨在提升无人机在复杂对抗环境中的作战效能. 研究基于某高仿真度的模拟平台, 利用态势感知和信息融合技术, 通过构造威胁指数和综合优势指数建立了空战态势分析模型, 并改进C4.5规则树算法设计、建立了上层决定决策、中层决定任务、下层决定行为的三个决策模型, 优化了无人机的战术行为和响应速度. 通过的实验验证发现, 该技术显著提高了无人机决策的准确性和执行效率, 从而提升了其在复杂空战环境中的作战效能. 本文的研究成果可为未来多无人机协同作战系统的设计和实现提供理论基础和技术支持.

    • 基于模糊强化学习和模型预测控制的追逃博弈

      2025, 40(6):1855-1865. DOI: 10.13195/j.kzyjc.2024.1039

      摘要 (322) HTML (395) PDF 106.40 K (481) 评论 (0) 收藏

      摘要:针对三维空间中智能体追逃博弈策略制定与鲁棒控制问题, 提出一种基于模糊强化学习与模型预测控制(MPC)的分层追逃博弈框架. 所提出框架结合三维空间的阿氏圆和模糊行动者-评论家学习(FACL)算法获得智能体的运动信息, 并将其用作MPC算法的参考输入来设计四旋翼无人机的控制器. 通过对四旋翼欠驱动系统模型进行解耦, 设计考虑误差系统积分项的高度、平移和姿态控制器. 通过FACL算法提供的参考信息, 有效提高了MPC算法的控制效率. 仿真和实验结果表明, 所设计的分层框架可以很好地解决三维空间追逃博弈问题.

    • 异步电机自适应的快速滑模控制方法

      2025, 40(6):1866-1872. DOI: 10.13195/j.kzyjc.2024.1139

      摘要 (189) HTML (389) PDF 75.05 K (328) 评论 (0) 收藏

      摘要:提出一种具有自适应能力的非奇异快速终端滑模控制(NFTSMC)方法, 可有效提升在外部扰动和参数变化下的异步电动机速度控制性能. 首先, 提出一种自适应非线性控制方法, 在增强系统抗干扰能力和动态响应性能的同时, 抑制滑模抖振现象; 其次, 提出的滑模负载转矩观测器(SMLTO)能够在负载转矩发生波动时, 迅速准确地跟踪到实际转矩, 从而减少负载转矩突变带来的速度波动, 提升控制精度和鲁棒性. 此外, 采用非奇异终端滑模控制方法, 不仅能加速系统状态的收敛, 还可避免传统滑模控制中的奇异性问题. 实验结果表明, 所提方法可显著提高异步电机速度控制系统的鲁棒性和响应速度, 并展现出优异的负载转矩观测性能.

    • 基于动态卷积和注意力机制的多域特征融合与运动想象解码

      2025, 40(6):1873-1882. DOI: 10.13195/j.kzyjc.2024.0942

      摘要 (199) HTML (411) PDF 94.24 K (356) 评论 (0) 收藏

      摘要:基于卷积神经网络(CNN)进行运动想象(MI)解码是智能康复的一个研究热点, 而目前的解码方法难以针对脑电信号的个体差异性动态深度挖掘其蕴含的时-频-空特征, 影响解码效果. 鉴于此, 提出一种基于动态卷积和注意力机制的CNN模型(DCAMNet). 首先, 使用滤波器组对每导原始脑电信号进行多频带划分, 同时输入特征提取模块; 然后, 由动态卷积块动态计算注意力权重, 获得有价值的时频信息, 再依次经空间卷积块和时间注意力块学习来挖掘空间信息和时间相关性, 以实现个性化时-频-空特征提取和融合; 最后, 由分类模块完成MI解码. 基于公开的BCI Competition IV Dataset 2a数据集对9名受试者进行4分类十折交叉验证实验, 取得了79.17%的平均准确率和0.788的$F_1 $值. 实验结果表明, DCAMNet能够自适应地关注和增强受试者个性化的特征, 可实现多域特征提取和融合, 相对于现有的流行方法在解码精度和泛化性能上具有一定优势.

    • 基于改进近端策略优化算法的柔性作业车间调度

      2025, 40(6):1883-1891. DOI: 10.13195/j.kzyjc.2024.0904

      摘要 (380) HTML (395) PDF 110.58 K (368) 评论 (0) 收藏

      摘要:柔性作业车间调度是经典且复杂的组合优化问题, 对于离散制造系统的生产优化具有重要的理论和实际意义. 基于多指针图网络框架和近端策略优化算法设计一种求解柔性作业车间调度问题的深度强化学习算法. 首先, 将“工序-机器”分配调度过程表征成由选择工序和分配机器两类动作构成的马尔可夫决策过程; 其次, 通过解耦策略解除动作之间的耦合关系, 并设计新的损失函数和贪婪采样策略以提高算法的验证推理能力; 在此基础上扩充状态空间, 使评估网络能够更全面地感知与评估, 从而进一步提升算法的学习和决策能力. 在随机生成算例及基准算例上进行仿真和对比分析, 验证算法的良好性能及泛化能力.

    • 基于新型观测器下的线性UAVs系统预设时间编队容错控制

      2025, 40(6):1892-1902. DOI: 10.13195/j.kzyjc.2024.1131

      摘要 (167) HTML (366) PDF 112.53 K (292) 评论 (0) 收藏

      摘要:研究状态不可知且存在外部干扰和执行器故障情形下的线性多无人机系统预设时间编队容错跟踪控制问题. 首先, 为编队中的每个跟随无人机的线性增广系统设计一类新型观测器, 利用周期时滞输出信息, 该观测器能够在预先设定的时间内同时实现状态观测、扰动观测以及故障估计; 然后, 基于观测器信息获得分布式任意预设时间编队容错跟踪控制协议, 无人机系统能够在物理允许范围的时间内迅速实现编队跟踪一致, 且用户预设时间的选取理论上与系统初值和参数均无关; 最后, 通过无人机系统编队的数值仿真验证理论结果的有效性. 该策略在工程应用中显示出一定的潜力价值, 试图为复杂环境下的多无人机编队快速控制提供解决方案.

    • 基于优势约束扩散策略的离线强化学习

      2025, 40(6):1903-1912. DOI: 10.13195/j.kzyjc.2024.0618

      摘要 (159) HTML (346) PDF 100.80 K (477) 评论 (0) 收藏

      摘要:离线强化学习旨在从静态的经验数据集中学习策略, 这种数据驱动的学习范式为强化学习在现实世界的应用提供了极大可能. 然而, 离线数据集通常由不同水平的策略收集而来, 其动作分布呈现出一种难以表达的多峰状态. 此外, 离线数据集中的高回报轨迹通常较为稀缺, 导致策略学习效率低下. 为此, 提出一种基于优势约束扩散策略的离线强化学习方法. 首先, 利用扩散模型的反向扩散步骤生成策略, 以更好地拟合多峰动作分布; 然后, 在策略提升阶段, 使用优势函数进行策略约束以帮助智能体更加专注于数量稀少的高回报轨迹, 并分别针对连续控制任务和稀疏奖励导航任务构建两种特定优势函数. 在bandit任务和D4RL基准上的实验结果表明: 所提方法能有效缓解行为策略表达能力受限及高回报轨迹稀缺的问题, 在大多数任务上获得最高的归一化得分.

    • 考虑多类型任务的成像卫星群调度模型与算法

      2025, 40(6):1913-1921. DOI: 10.13195/j.kzyjc.2024.0897

      摘要 (198) HTML (594) PDF 90.43 K (318) 评论 (0) 收藏

      摘要:面对日益增长的卫星数量和多样化的任务需求, 在轨成像卫星群任务调度的难度不断提升, 现有方法大多针对小规模或单一类型的卫星和任务, 难以适应大规模卫星资源下多类型任务的协同调度需求. 针对上述问题, 提出一种综合考虑多类型任务的成像卫星群调度模型与算法. 在模型构建方面, 设计广义观测收益函数, 统一评估包括普通点目标、周期性点目标和区域目标在内的不同任务类型的收益, 同时考虑卫星资源的限制和任务的特定要求, 以确保生成的调度方案合理高效; 在算法设计方面, 提出一种深度强化自适应大邻域搜索算法(DRL-ALNS), 利用深度强化学习的自主学习能力, 在自适应大邻域搜索框架中智能地进行算子选择和参数配置, 从而有效应对大规模搜索空间的挑战. 为了验证所提出方法的有效性, 将其与多种对比算法进行仿真实验. 结果表明, DRL-ALNS在任务收益值上平均提升7.6%, 验证了其在解决多类型任务成像卫星群调度问题中的有效性和优越性.

    • 考虑骑行者异质性的进站公交与自行车冲突博弈分析

      2025, 40(6):1922-1930. DOI: 10.13195/j.kzyjc.2024.0839

      摘要 (100) HTML (270) PDF 83.24 K (291) 评论 (0) 收藏

      摘要:为了研究骑行者异质性影响下进站公交与自行车通行概率的演化机制, 将自行车骑行者分为冒险型和保守型, 以公交车驾驶员和自行车骑行者各自通过冲突区域的损失最小为目标, 构建进站公交与自行车的冲突演化博弈模型, 引入前景理论和从众效应对模型进行优化, 求解并分析系统的演化结果, 利用数值仿真对模型的关键参数进行灵敏度分析. 研究结果表明: 交通管理部门应该制定优先规则引导系统收敛于不对称整数解; 基于前景理论考虑骑行者异质性和从众效应的演化博弈模型更加符合实际的交通场景; 从众效应和冒险型骑行者占比对自行车骑行者通过概率的影响是显著的, 公交优先通行权的设置能有效规避其对公交车驾驶员决策的影响; 各类型骑行者对自行车骑行者通过概率的主导地位并非体现在人数占比上. 此研究成果可以为制定公交站冲突区域的交通礼让规则提供理论基础与实践支持.

    • 基于信号补偿与强化学习的赤铁矿再磨压力智能PI控制

      2025, 40(6):1931-1938. DOI: 10.13195/j.kzyjc.2024.0743

      摘要 (141) HTML (327) PDF 87.68 K (274) 评论 (0) 收藏

      摘要:赤铁矿再磨过程是针对低品位赤铁矿的特有选矿过程, 给矿压力控制是再磨过程的关键工艺过程. 为了保证给矿压力的精确控制, 将常规PI控制与信号补偿技术和强化学习相结合, 提出一种智能PI控制方法. 首先, 将被控对象描述为低阶线性模型加频繁变化的未知非线性动态系统的形式, 采用精确计算的前一时刻未知非线性项和闭环运行数据, 设计补偿信号, 叠加到PI控制器的输出, 从而改善控制系统的动态性能; 其次, 利用闭环系统的实时运行数据, 采用强化学习迭代求取最优的PI控制器和补偿器参数, 保证闭环系统的稳定运行; 最后, 通过与已有方法的对比实验和工业过程真实数据的物理实验, 验证所提出方法的优越性.

    • 基于Transformer-DRL的机坪特种车群调度策略研究

      2025, 40(6):1939-1949. DOI: 10.13195/j.kzyjc.2024.0918

      摘要 (228) HTML (435) PDF 120.28 K (293) 评论 (0) 收藏

      摘要:针对机坪环境下多种类地面服务车辆的协同调度这一复杂的优化任务, 提出一种结合Transformer架构的深度强化学习算法. 首先, 依据航班地面服务流程的不同优先级, 将整个地面服务任务进行分解, 进而将原本复杂的多类型车辆调度问题转化为有先后顺序的单类型车辆调度问题; 接着, 利用Transformer架构对航班和车辆的特征进行自动提取, 通过解码器按序列逐步求解任务调度, 结合贪婪算法和蒙特卡洛模拟算法分别生成初步调度策略, 并将这些策略应用于每个子问题的求解过程中; 在此基础上, 利用深度强化学习算法对整个模型进行训练, 通过智能体与环境的交互来不断优化调度策略; 此外, 为了提升模型的鲁棒性和应对复杂情况的能力, 通过扩充真实数据集进行模型训练. 大量的实验结果证明, 基于Transformer架构的深度强化学习方法能够有效避免不同种类车辆之间的相互干扰, 并很好地应对真实环境下的航班调度需求.

    • 航空发动机分布式系统自适应事件触发H 容错控制

      2025, 40(6):1950-1958. DOI: 10.13195/j.kzyjc.2024.0977

      摘要 (112) HTML (257) PDF 92.25 K (256) 评论 (0) 收藏

      摘要:针对存在执行器故障、外部干扰、输入输出量化误差和网络诱导时延的不确定性航空发动机分布式控制系统, 提出自适应事件触发$H_{\infty}$控制方法. 首先, 对执行器故障、外部扰动、量化误差和系统不确定性进行数学描述, 给出自适应事件触发机制来提高网络资源的利用率, 并建立考虑以上因素的闭环系统数学模型; 然后, 利用Lyapunov-Krasovskii泛函方法建立保证系统渐近稳定的充分条件, 并给出以线性矩阵不等式形式的自适应事件触发器和$H_{\infty}$控制器的协同设计方法. 在给定的仿真条件下, 自适应事件触发机制节省的网络资源达到94 %, 相较于普通的事件触发器提升了46.4 %. 仿真结果表明, 所提出的事件触发器和控制器能够保证系统在以上考虑的不良因素下仍然渐近稳定.

    • 考虑商品间适应度的在线零售商分仓选品优化研究

      2025, 40(6):1959-1968. DOI: 10.13195/j.kzyjc.2024.1067

      摘要 (135) HTML (287) PDF 101.30 K (301) 评论 (0) 收藏

      摘要:随着在线零售业的快速发展, 线上订单数量日益庞大, 分仓选品对于高效服务线上订单愈发重要. 现有研究多从降低拆单率的角度优化选品方案, 忽略了拆单造成的额外运输距离差异. 鉴于此, 首先, 构建以最小化拆单率和运输距离为目标的分仓选品问题模型, 提出综合衡量订单商品分布与客户地理分布的商品间适应度指标; 然后, 结合谱聚类方法设计基于固定-优化框架的两阶段分仓选品算法. 数值实验表明: 与直接求解分仓选品模型相比, 所提出算法的固定阶段能够有效缩小搜索空间, 在保证求解质量的前提下能够提升求解效率; 与现有文献算法相比, 所提出算法能够显著降低运输距离和拆单率, 为企业优化分仓选品方案提供决策支持.

    • 一种基于概率分布分层图聚类网络的社区检测模型

      2025, 40(6):1969-1974. DOI: 10.13195/j.kzyjc.2024.0874

      摘要 (149) HTML (530) PDF 74.28 K (270) 评论 (0) 收藏

      摘要:为了捕捉网络的隐藏结构, 减少社区检测模型对初始参数选择的依赖性, 提出一种基于概率分布分层图聚类网络(HGCPD)的社区检测模型. 首先, 利用图卷积网络学习和缓存图中节点的特征表示; 然后, 引入一种基于节点对相似度概率的分层聚类方法, 在不同层次上递归地构建社区结构; 最后, 探究模型超参数优化问题, 设计贝叶斯优化方法自动调整参数, 从而提升模型效率. 在多个不同规模的网络数据集上的实验表明, HGCPD模型在社区检测的准确性、有效性均优于主流方法, 并通过可视化验证了所提出模型的可解释性.

    • 基于协同改进聚合策略的高效代理优化方法及应用

      2025, 40(6):1975-1984. DOI: 10.13195/j.kzyjc.2024.0733

      摘要 (132) HTML (273) PDF 107.32 K (319) 评论 (0) 收藏

      摘要:针对代理优化中样本策略贪婪特性使其后期收敛缓慢且解的精度不高的问题, 提出一种协同改进聚合策略, 并进一步拓展为面向昂贵黑箱问题的高效代理优化方法. 所提策略采用切比雪夫分解将概率改进和均值改进准则集成, 通过随机权重系数实现全局探索和局部搜索能力的平衡. 此外, 从候选点集视角出发, 分析代理优化与代理辅助优化方法二者的不同, 进一步挖掘随机因素在优化设计中的作用. 实验结果表明: 所提方法可有效提升昂贵黑箱问题优化解的收敛精度; 与同类方法相比, 该方法在解的精度和稳健性方面具有一定优势.

    • 基于新型导引向量场的自主水面船轨迹跟踪导引方法研究

      2025, 40(6):1985-1993. DOI: 10.13195/j.kzyjc.2024.0857

      摘要 (81) HTML (297) PDF 92.96 K (381) 评论 (0) 收藏

      摘要:针对自主水面船轨迹跟踪的导引问题, 提出一种基于新型导引向量场的轨迹跟踪导引方法. 首先, 为了简化导引律的设计, 以轨迹点为原点构建Serret-Frenet坐标系, 并在该坐标系下基于自主水面船运动模型构建轨迹误差模型; 然后, 考虑到相对位置对于自主水面船轨迹跟踪性能具有较大影响, 设计一种新型的导引向量场, 该向量场利用分段函数为自主水面船在与轨迹点不同相对位置情况下提供相应的导引律, 在保证相对稳定的艏向和速度的基础上实现高效精确的轨迹跟踪, 此外, 所提供的艏向角指令函数为光滑曲线, 用以提高实际中指令的可执行性; 其次, 依据该向量场设计艏向和速度的导引律, 基于Lyapunov稳定性理论证明系统的跟踪误差最终一致有界; 最后, 通过仿真验证所提出方法的有效性.

    • 一种基于凸剖分知情采样的最优路径规划算法

      2025, 40(6):1994-2002. DOI: 10.13195/j.kzyjc.2024.0457

      摘要 (220) HTML (416) PDF 97.28 K (406) 评论 (0) 收藏

      摘要:针对基于图搜索的路径规划算法难以在连续空间中找到最优路径和基于采样的路径算法路径生成效率低的问题, 提出一种基于凸剖分知情采样的最优路径规划算法(CDI-RRT*). 首先, 对静态地图进行凸剖分并建立拓扑图, 在拓扑图的指引下使用A*算法生成初始路径并结合弹性带算法对其进行优化, 从而获取局部最优路径; 之后, 在拓扑图的指导下构建初始树, 并结合剖分线约束与Informed-RRT*算法的知情集约束构建动态采样域, 通过在动态采样域中随机采样来优化初始树, 进而规划出最优路径; 最后, 将所提算法与目前先进的最优路径规划算法在仿真以及物理场景下进行实验对比. 实验结果表明, CDI-RRT*算法在多数场景下初始路径和最优路径的生成效率等核心指标均优于对比算法, 充分验证了所提出算法的可行性与有效性.

    • 面向感染错峰的疫情应急资源跨区域协同调度优化研究

      2025, 40(6):2003-2010. DOI: 10.13195/j.kzyjc.2024.0666

      摘要 (139) HTML (418) PDF 74.11 K (306) 评论 (0) 收藏

      摘要:面对重大突发公共卫生事件, 单体城市的防疫资源总是有限的, 而利用好不同城市感染错峰, 协同调度好城市群内部的不同防疫人员及物资, 可以有效提高应急救援效率. 基于此, 从感染错峰的视角构建一类涵盖应急医院选址、应急物资跨区域转运、医护人员跨区域支援的疫情应急资源跨区域协同调度优化模型. 在该混合整数规划模型中, 充分考虑资源调度过程中的多重异质性、多周期下多决策耦合效应等. 研究结果表明: 面对重大突发公共卫生事件时, 患者的需求满足率才是决策者首要的考虑因素; 在实施分级诊疗的过程中, 应选择轻症宽松匹配策略而非最优的完全匹配策略; 同时决策者也需要注意, 应急救援物资量、医护人员数以及应急医院容量等重要参数均存在较为明显的阈值效应. 这些研究结论可为重大突发公共卫生事件应急资源跨区域协同调度提供具体决策支撑.

    • 考虑运动稳定性的多机协调悬吊系统的动态重构轨迹规划

      2025, 40(6):2011-2021. DOI: 10.13195/j.kzyjc.2024.1107

      摘要 (117) HTML (273) PDF 100.69 K (286) 评论 (0) 收藏

      摘要:针对规划多机协调悬吊系统轨迹时忽略吊机末端轨迹和系统运动稳定性的问题, 提出一种考虑悬吊系统动态稳定性的多策略改进悬吊系统轨迹规划算法. 首先, 通过悬吊系统的运动学和动力学的分析得到动态轨迹稳定性评价标准; 然后, 定义轨迹动态稳定性、长度等多种悬吊性能参数, 针对传统冠豪猪算法与悬吊系统的适配性不足等问题, 通过加入Sine-Tent-Cosine混沌映射初始化种群, 提高算法初始解的多样性, 引入膺惩因子平衡勘探开发阶段; 在勘探阶段加入由等效偏差指数控制的柯西高斯扰动、池化机制增强算法全局搜索能力, 在开发阶段加入均衡全局和局部寻优的莱维巡回飞行策略、非线性增长的收敛因子来提高算法的收敛能力; 接着, 将多策略改进冠豪猪优化算法与碰撞检测算法相结合, 在分布有威胁区域的悬吊环境中得到被悬吊物和吊机末端的基尼不纯度最高的轨迹; 最后, 通过仿真验证了所提出考虑悬吊系统动态稳定性轨迹规划方案能够更好地适配多机协调悬吊系统, 得到符合悬吊性能要求的动态重构轨迹, 为后续悬吊系统的控制提供理论参考.

    • 安检场景的行人及携带物同步识别方法

      2025, 40(6):2022-2030. DOI: 10.13195/j.kzyjc.2024.0411

      摘要 (110) HTML (445) PDF 84.66 K (339) 评论 (0) 收藏

      摘要:在进站安检智能化进程中, 对于行人是否携带行李物品的识别研究至关重要. 针对在行人检测任务中忽视对所携带的物品一并进行检测, 且在复杂场景中由于多尺度和遮挡导致误检和漏检等问题, 提出一种在安检场景下的行人及携带物同步识别的方法; 构造一种易部署的轻量级深度学习网络模型PCD-MLNet检测行人及携带物目标, 使用改进的HGNetV2作为模型的主干网络, 提取不同尺度的输入特征; 提出一种可扩张的多分支残差模块DMRModule, 结合大核卷积操作, 增强行人及携带物特征提取的层次性和细节感知能力; 使用EIoU作为检测网络的定位回归损失函数, 提高模型对目标的定位能力. 在创建的行人-携带物数据集实验中, PCD-MLNet获得了良好的结果, 检测精度达到72.3%; 对冗余通道剪枝之后, 最终模型的参数量较基准模型下降了58.6%, 视频推理速度提升35.0%; 在仿真平台上的模拟安检实验也获得了不错的效果.

    • 动态事件触发通信下分布式预定时间非光滑约束优化算法

      2025, 40(6):2031-2040. DOI: 10.13195/j.kzyjc.2024.0973

      摘要 (213) HTML (264) PDF 103.60 K (259) 评论 (0) 收藏

      摘要:针对一类多智能体系统的非光滑约束优化问题, 通过构造合适的时变增益函数和动态事件触发通信机制, 提出一种结构简单的基于动态事件触发的分布式预定时间优化算法. 与现有分布式非光滑约束优化研究相比, 所提出的算法收敛性能更优, 收敛时间可由设计者提前给定且收敛时间上界与系统初始状态及控制参数无关; 通信效率更高, 避免了传统连续时间/周期通信带来的通信资源浪费问题; 算法结构更简单, 无需传统的分数幂反馈及额外的辅助变量. 综合运用预定时间收敛理论、惩罚函数法、代数图论及凸优化理论, 证明了系统决策变量在预定时间内收敛于最优解的可调邻域内, 且不存在 Zeno 现象. 仿真结果验证了所提出算法的优势及有效性.

    • 基于串联制造结构的装备制造企业柔性数量策略

      2025, 40(6):2041-2048. DOI: 10.13195/j.kzyjc.2024.0603

      摘要 (95) HTML (282) PDF 80.44 K (262) 评论 (0) 收藏

      摘要:随着装备产品精密化和商业环境复杂化, 数量柔性化正在成为装备制造企业应对内外部制造环境干扰、实现最优制造总利润的重要途径. 针对被忽略的制造结构、制造合格率、市场需求与数量柔性之间的内在逻辑关系, 结合装备制造企业制造系统的串联结构特征进行理论建模与分析, 以期回答“串联制造结构下装备制造企业如何选择最优匹配的柔性数量策略”这一问题. 研究结果表明: 与单环节制造结构相比, 串联制造结构的最优数量柔性更大、制造总利润更低; 串联制造结构的装备制造企业总有动机采用柔性数量策略; 串联制造结构下, 随着前序制造环节1的制造合格率提高, 装备制造企业的最优数量柔性呈倒U型变化; 随着数量柔性边际成本增加, 装备制造企业的最优数量柔性与制造总利润降低. 以上结论可为串联制造结构下装备制造企业柔性数量策略的制定与实施提供有益的参考.

年第卷第

关注官微服务更及时

刊期浏览
本期排行

下载排行

摘要点击排行

引用排行