主管单位:中华人民共和国教育部
主办单位:东北大学
国内刊号:21-1124/TP
国际刊号:1001-0920
创刊时间:1986年
出版周期:月刊
控制与决策期刊
中国控制与决策会议
2025,40(6):1761-1773, DOI: 10.13195/j.kzyjc.2024.1292
摘要:不确定性广泛存在于各种自然和工程系统中, 这对系统动力学的建模、分析、预测和控制提出巨大挑战. 对于工程控制系统, 已经发展出鲁棒控制相关理论以研究不确定性对系统动力学的影响及其综合设计问题. 然而, 对于大规模人在环路的集群自主系统, 不确定性下的系统动力学研究仍处于起步阶段. 鉴于此, 将经典控制系统中鲁棒控制的概念和方法扩展到大规模集群自主系统, 提出鲁棒博弈动力学的分析和综合方法, 针对类典型的不确定性研究了系统的演化动力学, 并结合经济学、心理学、社会学中的期望效用理论探讨博弈群体对不确定性的主观响应. 不确定性可以逆转经典博弈动力学的演化方向以及产生多稳态和周期振荡极限环等丰富的动力学行为, 所作研究揭示了不确定性对集群自主系统演化的重要影响以及群体博弈系统动力学的复杂性.
2025,40(6):1774-1792, DOI: 10.13195/j.kzyjc.2024.1431
摘要:智能工业化的迅速发展推动了技术设备的持续创新, 随之而来产生大量实时数据流. 在这些数据流中, 数据的统计特性随时间可能发生变化, 这一现象称为概念漂移. 概念漂移对机器学习模型的性能产生显著影响, 未能及时识别和应对会导致模型性能的逐步下降, 进而引发错误决策, 从而在工业应用中造成不可忽视的损失. 鉴于此, 从工业应用的角度出发, 总结目前概念漂移检测与适应的研究进展. 首先, 聚焦于有监督环境下的工业概念漂移检测方法, 从基于性能、窗口技术和集成方法角度详细总结相关技术的发展现状; 其次, 针对工业场景中常见的标签稀缺问题, 系统介绍半监督学习和无监督学习在工业概念漂移检测中的应用方法, 此外讨论工业环境中普遍存在的不平衡类问题对概念漂移检测的影响, 并综述解决这一问题的相关策略; 最后, 针对工业环境下的概念漂移适应方法进行总结, 并提出未来研究的方向, 以进一步提升概念漂移检测方法在复杂动态环境中的表现.
2025,40(6):1793-1806, DOI: 10.13195/j.kzyjc.2024.1037
摘要:红外与可见光图像融合(IVIF)技术旨在整合热辐射传感器和光学传感器所捕获相同场景的图像中的互补信息, 生成一张更适合人类理解或计算机分析处理的融合图像. 随着深度学习的发展, 该技术在军事侦察、自动驾驶、安防监控等领域的作用愈发重要. 以往的综述只对相关文献进行了归纳总结, 鲜有从网络结构以及损失函数发展历程的角度进行详细分析, 且缺乏最新的研究进展和对比实验. 鉴于此, 针对基于深度学习的IVIF方法展开全面回顾和展望. 首先, 从发展历程的角度对基于深度学习的IVIF方法进行回顾, 介绍其网络结构和损失函数的演进过程; 然后, 总结IVIF中常见的数据集以及性能评价指标, 并讨论未来所发布数据集应具备的特征; 接着, 对18种具有代表性的方法在3个公开数据集上进行大量实验, 从主观和客观的角度分析不同方法的性能; 最后, 总结IVIF任务当前所面临的挑战, 并展望未来的研究方向.
2025,40(6):1807-1816, DOI: 10.13195/j.kzyjc.2024.0808
摘要:针对柔性关节机械臂控制精度低和轨迹跟踪控制动态性能差等问题, 提出一种笛卡尔空间力补偿的轨迹跟踪控制算法, 旨在提高笛卡尔空间轨迹跟踪精度. 首先, 介绍串联弹性执行器和六自由度机械臂系统模型, 并设计基于神经网络模型预测控制的关节空间位置-速度-力矩混合控制算法; 接着, 基于该关节控制器设计基于柔性关节机械臂的笛卡尔空间力补偿控制算法, 根据笛卡尔空间的跟踪误差并结合PID控制器计算笛卡尔空间中的力补偿值; 其次, 将其转换为关节力矩补偿值并补偿到关节控制器, 以实现高精度的笛卡尔空间轨迹跟踪, 笛卡尔空间力补偿能够有效地抵消外部干扰和系统不确定性, 减小系统的跟踪误差, 使机械臂能够更准确地跟踪目标轨迹; 最后, 通过仿真和实验验证了该控制器的有效性和优越性. 实验结果表明, 所设计的轨迹跟踪控制器整体精度为1.86 mm, 相较于无补偿的轨迹跟踪和基于位置补偿的轨迹跟踪控制算法, 精度分别提升了2.91 mm和1.77 mm.
2025,40(6):1817-1826, DOI: 10.13195/j.kzyjc.2024.0852
摘要:为了推动低空经济发展, 提高企业经济效益和“最后一公里”配送效率, 提出考虑客户收益和时间窗的多行程卡车-无人机协同配送问题. 首先, 以最大化利润为目标建立基础的混合整数规划模型(MIP), 并融入有效不等式来减少基础模型的松弛度. 然后, 提出一种高效的混合启发式算法求解该问题, 同时, 考虑到具有时间窗特征的卡车-无人机路径较为复杂, 可行性判断耗时高, 设计一种基于Segment的有效评估方法来加速路径的可行性检查, 以提高算法的求解效率. 实验结果表明: 有效不等式可将精确求解器 —— Gurobi求解模型的速度提高44 %; 其次, 在不同规模的算例中, 所提出混合启发式算法在求解效率和质量方面均优于Gurobi与两类启发式对比算法, 并表现出良好的稳定性; 此外, 通过嵌入Segment有效评估方法可减少算法95 %的求解时间.
2025,40(6):1827-1837, DOI: 10.13195/j.kzyjc.2024.1245
摘要:针对公交客流检测因忽略边缘计算而导致的数据处理延迟和准确性问题, 基于“云-边-端协同架构”提出一种实时且轻量级的公交客流检测算法BPF-DETR. 首先, 采用RT-DETR-r18作为基线算法来提高实时处理能力; 然后, 引入轻量级iRMB模块更新ResNet-18作为特征提取主干, 通过倒置残差结构充分学习乘客目标的长距离特征交互以及小目标的局部特征交互, 在提高轻量性和精度的同时增强算法的边缘适用性; 接着, 引入ASF架构中的SSFF模块和TFE模块构建多尺度特征融合模块MSFM, 以进一步提升所提出算法在多尺度和复杂环境下的检测精度; 最后, 为了验证所提出算法的有效性, 采用基于ROI的图像拼接方法, 以提高数据集的代表性和多样性, 构建公交客流监控数据集进行训练验证. 实验结果表明, BPF-DETR的mAP@0.5为96.4 %, 模型大小为32.6 MB, 均优于目前主流的YOLO系列模型, 相较于基线算法, mAP@0.5提升了1.1 %, 模型大小下降了16 %, 能够满足公交客流检测准确率以及边缘部署轻量化要求.
2025,40(6):1838-1846, DOI: 10.13195/j.kzyjc.2024.1019
摘要:对于部分可观马尔可夫决策过程下的多智能体路径规划任务, 现有研究基于栅格或质点环境, 与真实物理环境有较大差距. 鉴于此, 研究如何在更加接近实际物理约束环境下提升多智能体协同路径规划的效果. 一方面, 在考虑真实物理约束的情况下, 根据执行器饱和以及欠驱动等构建多约束动作空间, 根据距离和位置等搭建多源输入状态空间, 设计抗冗余奖励函数来减小无人车行驶过程中动作冗余; 另一方面, 针对在Gazebo环境下训练难度高、效率低、难收敛等问题, 提出基于预训练-微调方法的多智能体双延迟深度确定性策略梯度算法, 利用预训练使得模型获得一个更优的初始值, 提升训练效率, 同时, 利用微调对预训练先验模型进行针对性优化, 增强模型训练过程抵抗环境非平稳性能力. 在Gazebo仿真环境中, 通过与PMATD3、MATD3、MADDPG等算法对比, 验证所提出算法的有效性.
2025,40(6):1847-1854, DOI: 10.13195/j.kzyjc.2024.0984
摘要:针对智能空中博弈中无人机协同决策的问题展开研究. 鉴于空中博弈复杂性, 包括不确定性、信息不完备性和动态性等特点, 提出了一种强鲁棒性的无人机协同决策技术, 旨在提升无人机在复杂对抗环境中的作战效能. 研究基于某高仿真度的模拟平台, 利用态势感知和信息融合技术, 通过构造威胁指数和综合优势指数建立了空战态势分析模型, 并改进C4.5规则树算法设计、建立了上层决定决策、中层决定任务、下层决定行为的三个决策模型, 优化了无人机的战术行为和响应速度. 通过的实验验证发现, 该技术显著提高了无人机决策的准确性和执行效率, 从而提升了其在复杂空战环境中的作战效能. 本文的研究成果可为未来多无人机协同作战系统的设计和实现提供理论基础和技术支持.
2025,40(6):1855-1865, DOI: 10.13195/j.kzyjc.2024.1039
摘要:针对三维空间中智能体追逃博弈策略制定与鲁棒控制问题, 提出一种基于模糊强化学习与模型预测控制(MPC)的分层追逃博弈框架. 所提出框架结合三维空间的阿氏圆和模糊行动者-评论家学习(FACL)算法获得智能体的运动信息, 并将其用作MPC算法的参考输入来设计四旋翼无人机的控制器. 通过对四旋翼欠驱动系统模型进行解耦, 设计考虑误差系统积分项的高度、平移和姿态控制器. 通过FACL算法提供的参考信息, 有效提高了MPC算法的控制效率. 仿真和实验结果表明, 所设计的分层框架可以很好地解决三维空间追逃博弈问题.
2025,40(6):1866-1872, DOI: 10.13195/j.kzyjc.2024.1139
摘要:提出一种具有自适应能力的非奇异快速终端滑模控制(NFTSMC)方法, 可有效提升在外部扰动和参数变化下的异步电动机速度控制性能. 首先, 提出一种自适应非线性控制方法, 在增强系统抗干扰能力和动态响应性能的同时, 抑制滑模抖振现象; 其次, 提出的滑模负载转矩观测器(SMLTO)能够在负载转矩发生波动时, 迅速准确地跟踪到实际转矩, 从而减少负载转矩突变带来的速度波动, 提升控制精度和鲁棒性. 此外, 采用非奇异终端滑模控制方法, 不仅能加速系统状态的收敛, 还可避免传统滑模控制中的奇异性问题. 实验结果表明, 所提方法可显著提高异步电机速度控制系统的鲁棒性和响应速度, 并展现出优异的负载转矩观测性能.
2025,40(6):1873-1882, DOI: 10.13195/j.kzyjc.2024.0942
摘要:基于卷积神经网络(CNN)进行运动想象(MI)解码是智能康复的一个研究热点, 而目前的解码方法难以针对脑电信号的个体差异性动态深度挖掘其蕴含的时-频-空特征, 影响解码效果. 鉴于此, 提出一种基于动态卷积和注意力机制的CNN模型(DCAMNet). 首先, 使用滤波器组对每导原始脑电信号进行多频带划分, 同时输入特征提取模块; 然后, 由动态卷积块动态计算注意力权重, 获得有价值的时频信息, 再依次经空间卷积块和时间注意力块学习来挖掘空间信息和时间相关性, 以实现个性化时-频-空特征提取和融合; 最后, 由分类模块完成MI解码. 基于公开的BCI Competition IV Dataset 2a数据集对9名受试者进行4分类十折交叉验证实验, 取得了79.17%的平均准确率和0.788的$F_1 $值. 实验结果表明, DCAMNet能够自适应地关注和增强受试者个性化的特征, 可实现多域特征提取和融合, 相对于现有的流行方法在解码精度和泛化性能上具有一定优势.
2025,40(6):1883-1891, DOI: 10.13195/j.kzyjc.2024.0904
摘要:柔性作业车间调度是经典且复杂的组合优化问题, 对于离散制造系统的生产优化具有重要的理论和实际意义. 基于多指针图网络框架和近端策略优化算法设计一种求解柔性作业车间调度问题的深度强化学习算法. 首先, 将“工序-机器”分配调度过程表征成由选择工序和分配机器两类动作构成的马尔可夫决策过程; 其次, 通过解耦策略解除动作之间的耦合关系, 并设计新的损失函数和贪婪采样策略以提高算法的验证推理能力; 在此基础上扩充状态空间, 使评估网络能够更全面地感知与评估, 从而进一步提升算法的学习和决策能力. 在随机生成算例及基准算例上进行仿真和对比分析, 验证算法的良好性能及泛化能力.
2025,40(6):1892-1902, DOI: 10.13195/j.kzyjc.2024.1131
摘要:研究状态不可知且存在外部干扰和执行器故障情形下的线性多无人机系统预设时间编队容错跟踪控制问题. 首先, 为编队中的每个跟随无人机的线性增广系统设计一类新型观测器, 利用周期时滞输出信息, 该观测器能够在预先设定的时间内同时实现状态观测、扰动观测以及故障估计; 然后, 基于观测器信息获得分布式任意预设时间编队容错跟踪控制协议, 无人机系统能够在物理允许范围的时间内迅速实现编队跟踪一致, 且用户预设时间的选取理论上与系统初值和参数均无关; 最后, 通过无人机系统编队的数值仿真验证理论结果的有效性. 该策略在工程应用中显示出一定的潜力价值, 试图为复杂环境下的多无人机编队快速控制提供解决方案.
2025,40(6):1903-1912, DOI: 10.13195/j.kzyjc.2024.0618
摘要:离线强化学习旨在从静态的经验数据集中学习策略, 这种数据驱动的学习范式为强化学习在现实世界的应用提供了极大可能. 然而, 离线数据集通常由不同水平的策略收集而来, 其动作分布呈现出一种难以表达的多峰状态. 此外, 离线数据集中的高回报轨迹通常较为稀缺, 导致策略学习效率低下. 为此, 提出一种基于优势约束扩散策略的离线强化学习方法. 首先, 利用扩散模型的反向扩散步骤生成策略, 以更好地拟合多峰动作分布; 然后, 在策略提升阶段, 使用优势函数进行策略约束以帮助智能体更加专注于数量稀少的高回报轨迹, 并分别针对连续控制任务和稀疏奖励导航任务构建两种特定优势函数. 在bandit任务和D4RL基准上的实验结果表明: 所提方法能有效缓解行为策略表达能力受限及高回报轨迹稀缺的问题, 在大多数任务上获得最高的归一化得分.
2025,40(6):1913-1921, DOI: 10.13195/j.kzyjc.2024.0897
摘要:面对日益增长的卫星数量和多样化的任务需求, 在轨成像卫星群任务调度的难度不断提升, 现有方法大多针对小规模或单一类型的卫星和任务, 难以适应大规模卫星资源下多类型任务的协同调度需求. 针对上述问题, 提出一种综合考虑多类型任务的成像卫星群调度模型与算法. 在模型构建方面, 设计广义观测收益函数, 统一评估包括普通点目标、周期性点目标和区域目标在内的不同任务类型的收益, 同时考虑卫星资源的限制和任务的特定要求, 以确保生成的调度方案合理高效; 在算法设计方面, 提出一种深度强化自适应大邻域搜索算法(DRL-ALNS), 利用深度强化学习的自主学习能力, 在自适应大邻域搜索框架中智能地进行算子选择和参数配置, 从而有效应对大规模搜索空间的挑战. 为了验证所提出方法的有效性, 将其与多种对比算法进行仿真实验. 结果表明, DRL-ALNS在任务收益值上平均提升7.6%, 验证了其在解决多类型任务成像卫星群调度问题中的有效性和优越性.
2025,40(6):1922-1930, DOI: 10.13195/j.kzyjc.2024.0839
摘要:为了研究骑行者异质性影响下进站公交与自行车通行概率的演化机制, 将自行车骑行者分为冒险型和保守型, 以公交车驾驶员和自行车骑行者各自通过冲突区域的损失最小为目标, 构建进站公交与自行车的冲突演化博弈模型, 引入前景理论和从众效应对模型进行优化, 求解并分析系统的演化结果, 利用数值仿真对模型的关键参数进行灵敏度分析. 研究结果表明: 交通管理部门应该制定优先规则引导系统收敛于不对称整数解; 基于前景理论考虑骑行者异质性和从众效应的演化博弈模型更加符合实际的交通场景; 从众效应和冒险型骑行者占比对自行车骑行者通过概率的影响是显著的, 公交优先通行权的设置能有效规避其对公交车驾驶员决策的影响; 各类型骑行者对自行车骑行者通过概率的主导地位并非体现在人数占比上. 此研究成果可以为制定公交站冲突区域的交通礼让规则提供理论基础与实践支持.
2025,40(6):1931-1938, DOI: 10.13195/j.kzyjc.2024.0743
摘要:赤铁矿再磨过程是针对低品位赤铁矿的特有选矿过程, 给矿压力控制是再磨过程的关键工艺过程. 为了保证给矿压力的精确控制, 将常规PI控制与信号补偿技术和强化学习相结合, 提出一种智能PI控制方法. 首先, 将被控对象描述为低阶线性模型加频繁变化的未知非线性动态系统的形式, 采用精确计算的前一时刻未知非线性项和闭环运行数据, 设计补偿信号, 叠加到PI控制器的输出, 从而改善控制系统的动态性能; 其次, 利用闭环系统的实时运行数据, 采用强化学习迭代求取最优的PI控制器和补偿器参数, 保证闭环系统的稳定运行; 最后, 通过与已有方法的对比实验和工业过程真实数据的物理实验, 验证所提出方法的优越性.
2025,40(6):1939-1949, DOI: 10.13195/j.kzyjc.2024.0918
摘要:针对机坪环境下多种类地面服务车辆的协同调度这一复杂的优化任务, 提出一种结合Transformer架构的深度强化学习算法. 首先, 依据航班地面服务流程的不同优先级, 将整个地面服务任务进行分解, 进而将原本复杂的多类型车辆调度问题转化为有先后顺序的单类型车辆调度问题; 接着, 利用Transformer架构对航班和车辆的特征进行自动提取, 通过解码器按序列逐步求解任务调度, 结合贪婪算法和蒙特卡洛模拟算法分别生成初步调度策略, 并将这些策略应用于每个子问题的求解过程中; 在此基础上, 利用深度强化学习算法对整个模型进行训练, 通过智能体与环境的交互来不断优化调度策略; 此外, 为了提升模型的鲁棒性和应对复杂情况的能力, 通过扩充真实数据集进行模型训练. 大量的实验结果证明, 基于Transformer架构的深度强化学习方法能够有效避免不同种类车辆之间的相互干扰, 并很好地应对真实环境下的航班调度需求.
2025,40(6):1950-1958, DOI: 10.13195/j.kzyjc.2024.0977
摘要:针对存在执行器故障、外部干扰、输入输出量化误差和网络诱导时延的不确定性航空发动机分布式控制系统, 提出自适应事件触发$H_{\infty}$控制方法. 首先, 对执行器故障、外部扰动、量化误差和系统不确定性进行数学描述, 给出自适应事件触发机制来提高网络资源的利用率, 并建立考虑以上因素的闭环系统数学模型; 然后, 利用Lyapunov-Krasovskii泛函方法建立保证系统渐近稳定的充分条件, 并给出以线性矩阵不等式形式的自适应事件触发器和$H_{\infty}$控制器的协同设计方法. 在给定的仿真条件下, 自适应事件触发机制节省的网络资源达到94 %, 相较于普通的事件触发器提升了46.4 %. 仿真结果表明, 所提出的事件触发器和控制器能够保证系统在以上考虑的不良因素下仍然渐近稳定.
2025,40(6):1959-1968, DOI: 10.13195/j.kzyjc.2024.1067
摘要:随着在线零售业的快速发展, 线上订单数量日益庞大, 分仓选品对于高效服务线上订单愈发重要. 现有研究多从降低拆单率的角度优化选品方案, 忽略了拆单造成的额外运输距离差异. 鉴于此, 首先, 构建以最小化拆单率和运输距离为目标的分仓选品问题模型, 提出综合衡量订单商品分布与客户地理分布的商品间适应度指标; 然后, 结合谱聚类方法设计基于固定-优化框架的两阶段分仓选品算法. 数值实验表明: 与直接求解分仓选品模型相比, 所提出算法的固定阶段能够有效缩小搜索空间, 在保证求解质量的前提下能够提升求解效率; 与现有文献算法相比, 所提出算法能够显著降低运输距离和拆单率, 为企业优化分仓选品方案提供决策支持.
2025,40(6):1969-1974, DOI: 10.13195/j.kzyjc.2024.0874
摘要:为了捕捉网络的隐藏结构, 减少社区检测模型对初始参数选择的依赖性, 提出一种基于概率分布分层图聚类网络(HGCPD)的社区检测模型. 首先, 利用图卷积网络学习和缓存图中节点的特征表示; 然后, 引入一种基于节点对相似度概率的分层聚类方法, 在不同层次上递归地构建社区结构; 最后, 探究模型超参数优化问题, 设计贝叶斯优化方法自动调整参数, 从而提升模型效率. 在多个不同规模的网络数据集上的实验表明, HGCPD模型在社区检测的准确性、有效性均优于主流方法, 并通过可视化验证了所提出模型的可解释性.
2025,40(6):1975-1984, DOI: 10.13195/j.kzyjc.2024.0733
摘要:针对代理优化中样本策略贪婪特性使其后期收敛缓慢且解的精度不高的问题, 提出一种协同改进聚合策略, 并进一步拓展为面向昂贵黑箱问题的高效代理优化方法. 所提策略采用切比雪夫分解将概率改进和均值改进准则集成, 通过随机权重系数实现全局探索和局部搜索能力的平衡. 此外, 从候选点集视角出发, 分析代理优化与代理辅助优化方法二者的不同, 进一步挖掘随机因素在优化设计中的作用. 实验结果表明: 所提方法可有效提升昂贵黑箱问题优化解的收敛精度; 与同类方法相比, 该方法在解的精度和稳健性方面具有一定优势.
2025,40(6):1985-1993, DOI: 10.13195/j.kzyjc.2024.0857
摘要:针对自主水面船轨迹跟踪的导引问题, 提出一种基于新型导引向量场的轨迹跟踪导引方法. 首先, 为了简化导引律的设计, 以轨迹点为原点构建Serret-Frenet坐标系, 并在该坐标系下基于自主水面船运动模型构建轨迹误差模型; 然后, 考虑到相对位置对于自主水面船轨迹跟踪性能具有较大影响, 设计一种新型的导引向量场, 该向量场利用分段函数为自主水面船在与轨迹点不同相对位置情况下提供相应的导引律, 在保证相对稳定的艏向和速度的基础上实现高效精确的轨迹跟踪, 此外, 所提供的艏向角指令函数为光滑曲线, 用以提高实际中指令的可执行性; 其次, 依据该向量场设计艏向和速度的导引律, 基于Lyapunov稳定性理论证明系统的跟踪误差最终一致有界; 最后, 通过仿真验证所提出方法的有效性.
李阿辉,刘锦元,付明磊,高魏磊,官柏平,应鑫森,SYCHOU Uladzislau
2025,40(6):1994-2002, DOI: 10.13195/j.kzyjc.2024.0457
摘要:针对基于图搜索的路径规划算法难以在连续空间中找到最优路径和基于采样的路径算法路径生成效率低的问题, 提出一种基于凸剖分知情采样的最优路径规划算法(CDI-RRT*). 首先, 对静态地图进行凸剖分并建立拓扑图, 在拓扑图的指引下使用A*算法生成初始路径并结合弹性带算法对其进行优化, 从而获取局部最优路径; 之后, 在拓扑图的指导下构建初始树, 并结合剖分线约束与Informed-RRT*算法的知情集约束构建动态采样域, 通过在动态采样域中随机采样来优化初始树, 进而规划出最优路径; 最后, 将所提算法与目前先进的最优路径规划算法在仿真以及物理场景下进行实验对比. 实验结果表明, CDI-RRT*算法在多数场景下初始路径和最优路径的生成效率等核心指标均优于对比算法, 充分验证了所提出算法的可行性与有效性.
2025,40(6):2003-2010, DOI: 10.13195/j.kzyjc.2024.0666
摘要:面对重大突发公共卫生事件, 单体城市的防疫资源总是有限的, 而利用好不同城市感染错峰, 协同调度好城市群内部的不同防疫人员及物资, 可以有效提高应急救援效率. 基于此, 从感染错峰的视角构建一类涵盖应急医院选址、应急物资跨区域转运、医护人员跨区域支援的疫情应急资源跨区域协同调度优化模型. 在该混合整数规划模型中, 充分考虑资源调度过程中的多重异质性、多周期下多决策耦合效应等. 研究结果表明: 面对重大突发公共卫生事件时, 患者的需求满足率才是决策者首要的考虑因素; 在实施分级诊疗的过程中, 应选择轻症宽松匹配策略而非最优的完全匹配策略; 同时决策者也需要注意, 应急救援物资量、医护人员数以及应急医院容量等重要参数均存在较为明显的阈值效应. 这些研究结论可为重大突发公共卫生事件应急资源跨区域协同调度提供具体决策支撑.
2025,40(6):2011-2021, DOI: 10.13195/j.kzyjc.2024.1107
摘要:针对规划多机协调悬吊系统轨迹时忽略吊机末端轨迹和系统运动稳定性的问题, 提出一种考虑悬吊系统动态稳定性的多策略改进悬吊系统轨迹规划算法. 首先, 通过悬吊系统的运动学和动力学的分析得到动态轨迹稳定性评价标准; 然后, 定义轨迹动态稳定性、长度等多种悬吊性能参数, 针对传统冠豪猪算法与悬吊系统的适配性不足等问题, 通过加入Sine-Tent-Cosine混沌映射初始化种群, 提高算法初始解的多样性, 引入膺惩因子平衡勘探开发阶段; 在勘探阶段加入由等效偏差指数控制的柯西高斯扰动、池化机制增强算法全局搜索能力, 在开发阶段加入均衡全局和局部寻优的莱维巡回飞行策略、非线性增长的收敛因子来提高算法的收敛能力; 接着, 将多策略改进冠豪猪优化算法与碰撞检测算法相结合, 在分布有威胁区域的悬吊环境中得到被悬吊物和吊机末端的基尼不纯度最高的轨迹; 最后, 通过仿真验证了所提出考虑悬吊系统动态稳定性轨迹规划方案能够更好地适配多机协调悬吊系统, 得到符合悬吊性能要求的动态重构轨迹, 为后续悬吊系统的控制提供理论参考.
2025,40(6):2022-2030, DOI: 10.13195/j.kzyjc.2024.0411
摘要:在进站安检智能化进程中, 对于行人是否携带行李物品的识别研究至关重要. 针对在行人检测任务中忽视对所携带的物品一并进行检测, 且在复杂场景中由于多尺度和遮挡导致误检和漏检等问题, 提出一种在安检场景下的行人及携带物同步识别的方法; 构造一种易部署的轻量级深度学习网络模型PCD-MLNet检测行人及携带物目标, 使用改进的HGNetV2作为模型的主干网络, 提取不同尺度的输入特征; 提出一种可扩张的多分支残差模块DMRModule, 结合大核卷积操作, 增强行人及携带物特征提取的层次性和细节感知能力; 使用EIoU作为检测网络的定位回归损失函数, 提高模型对目标的定位能力. 在创建的行人-携带物数据集实验中, PCD-MLNet获得了良好的结果, 检测精度达到72.3%; 对冗余通道剪枝之后, 最终模型的参数量较基准模型下降了58.6%, 视频推理速度提升35.0%; 在仿真平台上的模拟安检实验也获得了不错的效果.
2025,40(6):2031-2040, DOI: 10.13195/j.kzyjc.2024.0973
摘要:针对一类多智能体系统的非光滑约束优化问题, 通过构造合适的时变增益函数和动态事件触发通信机制, 提出一种结构简单的基于动态事件触发的分布式预定时间优化算法. 与现有分布式非光滑约束优化研究相比, 所提出的算法收敛性能更优, 收敛时间可由设计者提前给定且收敛时间上界与系统初始状态及控制参数无关; 通信效率更高, 避免了传统连续时间/周期通信带来的通信资源浪费问题; 算法结构更简单, 无需传统的分数幂反馈及额外的辅助变量. 综合运用预定时间收敛理论、惩罚函数法、代数图论及凸优化理论, 证明了系统决策变量在预定时间内收敛于最优解的可调邻域内, 且不存在 Zeno 现象. 仿真结果验证了所提出算法的优势及有效性.
2025,40(6):2041-2048, DOI: 10.13195/j.kzyjc.2024.0603
摘要:随着装备产品精密化和商业环境复杂化, 数量柔性化正在成为装备制造企业应对内外部制造环境干扰、实现最优制造总利润的重要途径. 针对被忽略的制造结构、制造合格率、市场需求与数量柔性之间的内在逻辑关系, 结合装备制造企业制造系统的串联结构特征进行理论建模与分析, 以期回答“串联制造结构下装备制造企业如何选择最优匹配的柔性数量策略”这一问题. 研究结果表明: 与单环节制造结构相比, 串联制造结构的最优数量柔性更大、制造总利润更低; 串联制造结构的装备制造企业总有动机采用柔性数量策略; 串联制造结构下, 随着前序制造环节1的制造合格率提高, 装备制造企业的最优数量柔性呈倒U型变化; 随着数量柔性边际成本增加, 装备制造企业的最优数量柔性与制造总利润降低. 以上结论可为串联制造结构下装备制造企业柔性数量策略的制定与实施提供有益的参考.
摘要:人体下肢运动的步态周期由支撑相和摆动相构成,其中,支撑相是步态周期中相对较长且稳定的阶段,但现有的人体运动步态意图识别通常对摆动相进行特征提取,往往忽略了支撑相的连续细节信息. 考虑到人体对于地形转换的适应性姿态调整始于支撑相末期的足底动力相. 为此,本文提出了一种足底动力相数据驱动的智能下肢假肢意图识别方法. 足底动力相作为连接支撑相和摆动相的过渡阶段,在运动过程中参与能量释放,本方法提取完整足底动力相数据,并结合摆动相前期数据,定义目标数据时间窗. 考虑到支撑相中时域信号动态变化不明显,不同于传统的时域统计特征,本方法采用haar小波变换来表征支撑相中隐藏的非平稳信号特征,基于足底蹬地的能量变化进行多尺度分析,自适应地确定最优分解层数,并由此得到相应小波系数,构建特征向量. 最终,使用支持向量机进行分类. 实验结果表明,该方法在自采集数据集的5种稳态模式下识别率可达到99.21%,在13种综合运动模式下的识别率为97.65%,较基准方法提升了1.69%,2.53%. 本文利用足底动力相阶段的数据辅助意图识别任务,提高了模型的识别率和鲁棒性.
优先出版时间:2025-05-09 DOI: 10.13195/j.kzyjc.2024.1470
摘要:行人轨迹预测在智能交通、自动驾驶与视频监控等应用领域有着广泛的应用,对行人间复杂的交互关系进行全面建模是提升轨迹预测准确率的关键问题。已有的基于神经网络的建模方式存在忽略行人间的持续影响,以及静态的图卷积算法无法适应动态变化的图结构的问题。为此,本文提出了一种基于社会时间图的轨迹预测模型 STGCR(Spatio-Temporal Graph Cross-interaction Transformer). 该模型通过量化不同时空行人对目标行人的异步交互关系,融合行人间的动态信息,并将其应用于图卷积算法中。 此外 STGCR 引入了一种时空加权注意力机制,显式计算行人间的空间与时间特征的关系。实验结果表明,与 STAR 模型相比,在预测未来8个时间步时,所提出的模型在公开数据集 (ETH 和 UCY) 上平均位移误差和最终位移误差分别降低39.6%与30.8%。
优先出版时间:2025-05-09 DOI: 10.13195/j.kzyjc.2025.0040
摘要:为了提高自动驾驶车辆轨迹跟踪控制精度与鲁棒性, 提出了基于车辆误差动力学模型的自动驾驶车辆轨迹跟踪非线性鲁棒控制方法. 在车辆运动学模型和非线性车辆动力学模型的基础上, 构建车辆误差动力学模型?从理论上推导二阶系统的非线性鲁棒控制器设计方法, 并利用李亚普洛夫稳定性理论证明其正确性? 以此为基础, 设计基于车辆误差动力学模型的自动驾驶车辆轨迹跟踪非线性鲁棒控制器, 并通过仿真验证了所提方法的有效性. 结果表明, 非线性鲁棒控制器可有效提高轨迹跟踪控制精度, 削弱系统参数不确定性引起的控制抖动和控制精度不高的问题, 且可有效减弱测量噪声对轨迹跟踪的影响.
优先出版时间:2025-05-09 DOI: 10.13195/j.kzyjc.2025.0035
摘要:目标检测是深度学习领域中的一个重要分支,大量的边缘设备需要轻量级的目标检测算法,但现有的轻量级目标检测算法存在检测精度不足、特征融合能力较弱及检测速度较慢等问题.针对这一问题,本文在YOLOv8n基础上提出基于空间分组内卷积的轻量级目标检测算法.首先,在内卷积(Involution)基础上提出一种新型空间分组内卷积(Spatial Group-Wise Involution, SGWInvo),克服了内卷积空间信息建模方面的不足问题,同时有效弥补卷积网络中因共享卷积核在特征表达上的局限性.基于SGWInvo进一步设计了一种轻量化主干网络SCNet替换YOLOv8n主干网络.其次,提出一种双向路径聚合网络(DPAN),提高了多尺度目标的特征融合能力.最后,采用深度可分离卷积对检测头进行轻量化,结合YOLO2YOLO的分步训练策略,消除NMS带来的推理时延.本文包括两种检测方法:一对多匹配的SGWInvo-YOLO和一对一匹配的SGWInvo-YOYO.在COCO数据集上的实验表明,与YOLOv8n相比,本文两种算法参数量均降低了23.3%.SGWInvo-YOLO与之推理速度相当,mAP0.5和mAP0.5:0.95精度分别提升3.0%和2.3%.SGWInvo-YOYO推理时延减少10.5%,mAP0.5和mAP0.5:0.95精度分别提升2.3%和0.9%.
优先出版时间:2025-05-09 DOI: 10.13195/j.kzyjc.2024.1393
摘要:针对一类具有状态约束和不可测状态的非线性系统,提出了一种基于观测器的自适应神经网络有限时间命令滤波控制方案.首先,构造积分障碍李雅普诺夫函数来确保系统的状态变量满足时变约束条件;其次,考虑到大多数非线性系统的状态是不可测的,设计了一个自适应神经网络状态观测器对不可测状态进行估计;然后,在控制器设计过程中采用命令滤波控制方法,避免了“微分爆炸”现象,并进一步引入了误差补偿机制消除了滤波误差;此外,为了解决输入死区问题,将死区模型描述为线性输入和有界扰动的形式.所提方法保证了系统状态不会超出约束边界,闭环系统中所有信号在有限时间内是有界的,且跟踪误差在有限时间内收敛到原点附近邻域内.最后,通过两个例子验证了所提方法的有效性.
优先出版时间:2025-05-08 DOI: 10.13195/j.kzyjc.2025.0230
摘要:针对深度学习中标准训练集无法全面覆盖实际工况中的故障特征,导致故障识别率急剧下降的问题,提出了一种融合一维卷积神经网络(1DCNN)和Transformer 层的域适应神经网络(Domain Adversarial Neural Network, DANN)迁移学习方法Transformer-DANN。使用1DCNN 和Transformer 层,改进特征提取器的提取特征的能力,降低了计算复杂度;针对不同负载下故障数据特征不同的问题,采用DANN方法,对故障数据进行分类处理。对所提出的方法进行了实验验证,在电机变工况条件下,平均识别率达到98.26%,最大识别率为99.42%。结果表明,本文方法能有效提高变工况条件下的电机故障识别准确率,可以满足现实应用中设备故障诊断的任务需求。
优先出版时间:2025-05-08 DOI: 10.13195/j.kzyjc.2025.0124
摘要:首先,设计一种由习得策略和扰动模型组成的温和泛化策略,以对未见过的动作具有一定的适应性。其次,在习得策略的更新网络中引入退火行为克隆作为惩罚,逐渐提高习得策略的泛化能力。此外,将不确定性引入Q值函数的估计中,利用温和泛化策略构造不确定性量化器,实现对不确定性的有效量化,进而减小认知误差。理论分析证明,UAMG能够有效降低习得策略的次优性。D4RL基准上的实验表明:相较于对比方法,UAMG在认知误差的抑制方面表现优异且在多数任务上获得最高的回报。
优先出版时间:2025-05-08 DOI: 10.13195/j.kzyjc.2024.1461
摘要:深度立体匹配网络使用代价体将三维场景结构编码为双目特征的对应关系,在机器人定位与避障等场景具有重要应用前景.然而,现有代价体方法不能为双目特征建立全面且无冗余的相关信息,导致视差预测精度不足.针对该问题,首次将极线几何约束引入代价体计算流程,通过多类型代价体优势互补,提出一种即插即用的融合代价体及其代价聚合方法.首先,融合代价体同步计算极线共投影区域内特征向量的全局点积相关信息和局部分组点积相关信息,保证特征相关的全面性并有效避免了信息冗余.其次,在周边信息聚合过程中结合传统聚合方法和融合代价体特性,提出一种基于深度可分离卷积的自适应加权降维方法,解决了融合代价体在聚合阶段的维度不平衡性和计算效率问题.将所提方法集成到立体匹配框架并命名为FusionStereo,在基准数据集上进行实验验证.结果表明:FusionStereo在KITTI 2015域内训练后的误匹配率指标BAD3为1.55%,在MiddleBurry跨域测评的误匹配率指标BAD1为17.1%,明显优于其他类型代价体的对比方法.
优先出版时间:2025-04-28 DOI: 10.13195/j.kzyjc.2024.1390
摘要:在红外图像中,目标物体的突出显示与可见光图像中丰富的纹理细节相结合,可以有效地增强融合图像的信息熵,从而为夜间智能驾驶等下游视觉任务提供重要支持。然而,现有的主流融合算法对于可见光图像在恶劣光照夜间道路环境下的信息熵低与像素强度高之间的矛盾,缺乏针对性的研究。因此,在正常环境下表现良好的融合算法,在强光干扰下往往只能生成与可见光图像相似、信息熵较低的融合图像。为解决这一问题,本文提出了一种能够抵抗恶劣光照环境干扰的图像融合网络,结合信息熵和信息论原理,增强了图像融合的鲁棒性和信息保留能力。具体而言,本文首先设计了一个在正常光照条件下具备高鲁棒性和优异性能的图像融合网络。在该融合网络的基础上,本文设计了一个环境光感知模块,以便在极端光照条件下对低信息熵的可见光图像的特征权重进行分析。此外,本文还设计了一个红外边缘特征分层引导融合模块,以充分提取红外图像中的有效特征信息。实验结果表明,该融合网络能够在夜间恶劣光照条件下充分利用可见光和红外图像的特征信息,显著提高了这种情况下融合图像的质量。与其他主流算法相比,该方法生成的融合结果包含了更丰富和更有效的信息。
优先出版时间:2025-04-28 DOI: 10.13195/j.kzyjc.2025.0052
摘要:为解决现有滑模控制方法在不确定非线性系统中存在的收敛速度依赖初值、鲁棒性差等问题,提出了一种新型全局固定时间滑模控制策略。首先,设计的固定时间扰动观测器能有效消除系统中不确定性扰动的不利影响;其次,使用了一种新型非奇异快速终端滑模面,它不仅成功克服了奇异性问题,还显著提升了系统的鲁棒性,且其收敛时间与系统初始状态无关。再次,通过结合反正切(arctan, A)函数和双曲正切(tanh, T)函数设计了新的 AT 趋近律,有效抑制了系统抖振现象;同时,运用李雅普诺夫稳定理论证明了固定时间扰动观测器和非奇异快速终端滑模的稳定性。最后,二连杆机械臂实验结果进一步验证了该算法具有良好的控制效果。
优先出版时间:2025-04-27 DOI: 10.13195/j.kzyjc.2025.0112
摘要:随着地球观测领域相关技术的高速发展,近年来具有先进姿态调整能力的敏捷地球观测卫星已经引起了广泛的关注。敏捷卫星任务调度具有时间依赖性切换时间,在多星、多轨道、多需求的卫星观测场景下,产生了复杂的时间依赖性多敏捷卫星多目标调度问题。针对该问题,首先,基于问题特征和优化目标建立了问题的数学规划模型。其次,提出一种分布式元Q学习协同进化框架,包括预训练和进化搜索两个阶段,预训练阶段通过分布式Q学习提高训练效率,进化搜索阶段通过训练好的分布式Q学习模型实现多种群进化算子的自适应选择。然后,基于所提出的进化框架和问题特征,设计了多样化的进化算子和动态种群划分选择策略,建立了一种分布式元Q学习协同进化算法(Distributed Meta-Q-Learning Co-Evolutionary Algorithm, DMCEA)。最后,实验验证了DMCEA求解问题的有效性。
优先出版时间:2025-04-27 DOI: 10.13195/j.kzyjc.2025.0275
摘要:针对分布式流水车间中加工时间不确定性与序列相关准备时间耦合的鲁棒调度问题,提出一种强化学习驱动的迭代局部搜索算法(QILS).首先,构建以最大完工时间为目标的期望-风险鲁棒调度模型,平衡调度方案的稳定性与最优性.其次,设计面向不确定环境的NEHUPT启发式方法,基于场景分析生成工件的调度优先级,结合微调策略提升初始解的质量;另外,构建Q-learning与迭代局部搜索算法的协同优化框架,利用强化学习以及动态衰减方法驱动扰动策略的动态选择,平衡算法的搜索和开发能力;最后,提出一种基于鲁棒贡献度的局部搜索方法,进一步提升解的质量.通过系统性的仿真实验及与多种先进代表性算法的对比分析,实验结果表明,所提出的算法在求解分布式鲁棒车间调度问题方面具有显著优势.
优先出版时间:2025-04-27 DOI: 10.13195/j.kzyjc.2024.1463
摘要:共享单车的时空分布和使用模式对其系统的部署和运营至关重要.本文从动力、停靠方式出发,对不同种类共享单车的出行特征和访问规律进行了深入研究,揭示了出行距离、回转半径、等待时间等空间、时间特征的分布规律,在此基础上对共享单车出行范围、使用突发性进行了分析.此外,采用Levenberg-Marquardt算法发现了特定位置共享单车流量与出行距离、频率之间的高斯函数和指数函数关系.最后,提出了衡量聚散程度变化的流量维纳指数,量化了共享单车的潮汐现象.
优先出版时间:2025-04-27 DOI: 10.13195/j.kzyjc.2024.0929
摘要:本文基于排队论模型,提出充电桩利用率作为充电站选址规划中的重要考虑因素,依此以用户的充电拒绝率、充电桩利用率及运营商投资总成本为三个目标建立多目标充电站选址优化模型。进而,本文通过真实的车辆运动轨迹数据进行实验分析,通过研究车辆在行驶过程中的驻留行为,分析用户的实际充电需求。在候选点的选取规划中,引入了ArcGIS软件,利用其优秀的空间计算能力,在地图中选取出合适的候选充电站点。为求解模型,提出了一种改进多目标粒子群算法,并与其它智能优化算法对比分析,验证了改进算法的合理性和有效性。通过仿真实验,本文进一步分析了不同充电站数量及充电桩功率对充电站规划过程中各指标的影响。结果表明:当充电站数量达到一定规模时,一味地建设充电站并不会使服务效率得到提升;不同充电功率对充电站拒绝率影响较小,但是会显著影响到充电桩的利用率。
优先出版时间:2025-04-27 DOI: 10.13195/j.kzyjc.2025.0002
摘要:工业现场普遍存在复杂的噪声环境,其中非高斯噪声和未知有界噪声的混合干扰严重制约了传统重放攻击检测技术的性能,为此,本文提出一种基于状态估计的动态阈值检测算法。根据线性系统中未知有界噪声的幅值约束和非高斯噪声的高阶统计属性,开发依托椭球理论和无偏有限脉冲响应滤波的新型状态估计机制,解决现有算法在双重噪声环境下,因先验统计模型失配而引发的估计性能劣化问题,然后利用系统实时数据设计动态阈值检测策略,克服重放攻击中固定阈值检测器灵敏度不足的缺陷,最后运用系统残差构建攻击检测函数,对系统中潜在的重放攻击进行识别。仿真结果证明,所提方案为此类噪声系统的重放攻击检测提供了一种更加可靠的技术手段,并展现出优异的适应性。
优先出版时间:2025-04-26 DOI: 10.13195/j.kzyjc.2024.1397
摘要:针对遭受虚假数据注入(false date injection, FDI)攻击的多四旋翼飞行器系统,本文提出了基于命令滤波器的预设时间一致性跟踪控制算法.首先,引入命令滤波器并构建误差补偿机制,在避免"复杂度爆炸"的同时移除了滤波误差对系统的影响;其次,巧妙利用坐标变换建立了系统真实状态与受损状态之间的联系,并结合Nussbaum函数控制方法和自适应控制技术,解决了FDI攻击产生的未知控制增益问题;然后,利用Lyapunov 稳定性理论证明了系统预设时间稳定、闭环系统中的所有信号有界以及多四旋翼飞行器的一致性跟踪误差在预设时间内收敛到原点附近的邻域内;最后,通过仿真算例验证了所提控制算法的有效性.
优先出版时间:2025-04-25 DOI: 10.13195/j.kzyjc.2025.0165
摘要:矿井通风网络优化调节是矿井通风系统安全、稳定、经济运行的重要保障。通风网络结构和状态参数随机动态变化给矿井通风网络优化求解和决策带来了极大的挑战。本文充分考虑矿井通风系统的随机不确定性,提出了一种基于深度强化学习的矿井通风网络鲁棒优化调控方法。首先,对矿井通风网络风量优化问题进行数学描述,将该风量优化问题建模为马尔可夫决策过程模型,无需对系统不确定性进行建模和预测;然后,采用一种改进分布式近端策略优化算法对连续风量优化问题进行动态优化和决策,能够直接得到不同需风量的优化调控方案。实验结果表明,本文所提方法能够有效应对通风系统的多重不确定性,降低矿井通风系统的风机能耗。
优先出版时间:2025-04-24 DOI: 10.13195/j.kzyjc.2024.1153
摘要:针对线上线下 (online to offline, O2O) 药品配送取货药店选择与骑手路径问题,依据单一药店持有药品种类有限且客户订单需齐套性配送的实际情形,以平台配送总成本最小化为目标,构建 O2O 药品配送取货药店选择与骑手路径协同优化模型。并结合模型复杂性特点,设计人工免疫与蚁群嵌套算法进行求解。多组不同规模及现实场景的算例分析结果表明,O2O 药品配送取货药店选择与骑手路径协同优化,可以有效提高配送资源利用率,降低平台配送总成本。药品种类数变化对骑手数影响甚微,对配送路径成本和平台配送总成本有一定的正向影响,连锁药店药品库存充裕量增加可以降低平台配送总成本和拆单率。研究结论可为平台制订 O2O 药品订单骑手取送方案提供有益的参考。
优先出版时间:2025-04-24 DOI: 10.13195/j.kzyjc.2025.0110
摘要:贝叶斯网络(Bayesian Network,BN)是一种概率图模型,用来表示不确定的因果关系.由于解空间的数量随着变量数量增长呈超指数增长,使贝叶斯网络结构学习(Bayesian Network Structure Learning,BNSL)成为NP难问题.遗传算法可以高效的在空间中搜索更多可能的结构组合,在BNSL问题中取得了诸多成果,但仍存在过早收敛,结构准确率不高等问题.本文提出一种基于种群多样性和互信息混合引导的贝叶斯网络结构学习算法来解决以上问题.在去环阶段,使用翻转-删除-修复混合操作代替删除边以保留更多样的基因型.在选择算子,根据当前种群多样性动态调整种群年龄阈值,淘汰衰老个体,维持合理的种群年龄结构.在交叉策略中引入生物学的基因型频率概念,保护低频结构的同时利用互信息限制搜索空间大小并引导搜索.本文在10个标准BN数据集上对DM-GABN进行了实验评估,并与包含最先进方法在内的10种BNSL方法进行对比.实验结果显示,所提出的方法学习的BN结构准确率更高,算法收敛速度更快.
优先出版时间:2025-04-22 DOI: 10.13195/j.kzyjc.2025.0020
摘要:针对干扰环境下机械臂的安全交互控制问题, 提出一种基于控制障碍函数的机械臂全身动态避障与安全柔顺控制方法. 为保证系统鲁棒安全的同时降低保守性以提高跟踪性能, 提出基于非线性干扰观测器的可调输入至状态安全高阶控制障碍函数, 其能够处理高相对度约束, 进而拓宽输入至状态安全控制障碍函数的适用范围. 进一步, 利用所提出的控制障碍函数建立不等式约束, 并在二次规划框架下通过最小限度修改参考控制输入来形成鲁棒安全关键控制器. 该控制器在机械臂连杆的多个位置构建与障碍物之间的虚拟安全屏障, 以实现整个机械臂对静/动态障碍物的规避. 同时, 在机械臂末端建立多个动态空间约束, 以确保机械臂在预设的安全区域内执行交互任务. 此外, 基于Nagumo定理证明安全集合的前向不变性, 并用仿真和实验验证所提出方法的有效性.
优先出版时间:2025-04-22 DOI: 10.13195/j.kzyjc.2024.1456
摘要:针对受切换通信拓扑影响的非线性多智能体系统量化一致性问题,本文提出了一种学习型模型预测控制(LMPC)算法.该算法利用神经网络实时逼近并优化LMPC代价函数,在线预测最优控制增益矩阵,有效减小通信缺陷对系统性能的影响.同时,结合迟滞量化器对控制输入进行量化,缓解了网络资源受限对多智能体协同性能的限制.为描述多智能体间的信息交换,引入了部分转移概率未知的Markov切换拓扑结构.在此基础上,构建了相应的Lyapunov函数,并将其作为LMPC的代价函数.最后,通过非线性摆系统验证了所提方法的有效性和适用性.
优先出版时间:2025-04-21 DOI: 10.13195/j.kzyjc.2024.1353
摘要:在非结构化任务环境中,多个移动机器人通过协同重构形成组合体机器人是提升机器人任务适应性的重要手段,然而总体而言,关于组合体机器人实际应用部署的建模与控制方面的进展仍然不足.本文基于非完整约束与拉格朗日方法,建立了任意重构尺度下组合体机器人的运动学和动力学模型.在运动学层级,设计了基于自适应边界补偿安全围栏的平滑避障策略,保障在运动过程中的安全性.在动力学层级,通过引入自适应协作容错机制,保障组合体机器人系统转矩分配的合理性,避免性能下降,以增强运动过程中的容错能力.同时,提出了一种新型的滤波扩张状态观测器,该观测器可通过抑制噪声引起的高频振荡现象,实现未知集总扰动下对速度的鲁棒跟踪控制. 最后,搭建真实的组合体机器人实验平台,进一步验证所提出方法的容错性、鲁棒性和安全性.
优先出版时间:2025-04-21 DOI: 10.13195/j.kzyjc.2025.0057
摘要:本文研究了虚假数据注入攻击下, 非线性信息物理系统中攻击检测的报警响应问题. 建立了一种模糊模型, 用于处理信息物理系统的非线性特性. 首次在模糊模型中引入了分布式融合策略来检测虚假数据注入攻击,能够应对更复杂的现实场景,并提高检测准确性和可靠性, 从而提升报警响应速度. 为了实现实时在线异常检测,部署的传感器通过通信网络将数据传输至监控中心. 考虑到带宽限制, 采用了多个有限级对数量化方法来减少数据包大小, 从而提高传输效率. 接着, 通过凸优化方法设计了最优的分布式融合方案, 提高了在量化误差存在时的检测精度. 最后, 以质量-弹簧- 阻尼系统为例, 验证了该方法相比单传感器系统能够更快速地响应攻击, 展现了显著的优势.
优先出版时间:2025-04-19 DOI: 10.13195/j.kzyjc.2024.1448
摘要:燃气轮机发电系统是火力发电装备的核心组成部分,然而系统中压气机叶片的积垢等因素会导致其性能退化。因此,实时评估压气机性能退化程度,并在适当时候进行水洗措施,对于确保压气机的安全可靠运行至关重要。但是,出于安全性和经济性等因素的考虑,电厂通常不允许压气机在严重退化的条件下运行,故压气机严重退化状态数据获取困难,传统数据驱动的退化评估模型难以建立,从而无法预测退化程度以判断是否需要进行水洗措施。进一步地,考虑到压气机性能随燃机负荷不同而有不同表现,这种差异对评估压气机的实际退化程度产生了干扰,增加了准确判断其性能退化情况的难度。针对上述问题,本文提出了压气机退化知识引导的退化差值生成对抗网络,在严重退化数据完全缺失的零样本场景下,利用专家标注的先验知识对性能轻微退化的数据特征实施定向劣化,生成性能严重退化的数据特征,进而有监督地训练退化评估模型。为了缓解负荷变化造成的干扰,本文将不同负荷工况视为多个域,从运行数据中提取消除变负荷影响的特征,并通过设计知识预测器,在这些特征中保留各类先验知识的信息,提升退化差值生成对抗网络的生成质量。本文使用真实压气机运行数据对方法有效性进行了验证,与其它零样本学习方法相比,本方法退化等级评估调和平均准确率提升 5.22%。
优先出版时间:2025-04-19 DOI: 10.13195/j.kzyjc.2024.1407
摘要:在碳限额与交易政策下,构建了一个由生产外包的原始设备制造商(OEM)和竞争的合同制造商(CM)构成的竞合供应链系统,考虑溢出效应,通过对比企业不减排投资、CM减排投资、OEM减排投资以及联合减排投资四种场景,对供应链减排投资策略选择问题展开研究.结果表明:首先,相较于不投资,CM总能从投资中获益.多数情况下CM选择联合投资,但竞争占主导时,则会选择单独投资.对OEM而言,搭便车并非总是有利可图,联合投资能够显著提升其效益.其次,竞合关系中合作占主导或者竞争较弱时联合投资为CM和OEM的均衡策略.再次,碳交易价格、溢出系数会影响企业在竞争与合作之间的倾向性,调节企业间的竞合关系,进而影响供应链企业的决策行为.最后,通常情况下供应链减排投资能获得更好的环境绩效,但当单位产品的初始碳排放量很大时会出现“减排努力困境”.
优先出版时间:2025-04-18 DOI: 10.13195/j.kzyjc.2024.1333
摘要:球团矿是现代高炉炼铁的重要原料,合理的粒度分布是影响球团矿质量的重要因素之一。目前球团矿生产过程中,粒度分布检测主要依赖人工离线筛分的方式,该方法效率低,测量结果滞后,难以满足工业生产现场实时性要求。且密集球团颗粒存在重叠、曲面光影 等噪声的干扰,现有基于图像处理的粒度检测方法对其边缘轮廓检测能力有限,易使出现漏检或过分割现象。针对上述问题,本文提出一种融合双重注意力与多尺度级联网络的密集球团粒度测量方法(LMAD-UNet)。该方法将两个UNet以并行级联的方式拼接作为骨干网络,增加网络宽度,降低网络下采样特征损失;其次,设计一种轻量多尺度融合模块(LMulti-Res Block),实现多尺度特征提取,减少模型参数量,提升推理速度,同时引入双重注意力机制,增强网络对轮廓特征的提取能力;最后改进了损失函数,加强对不平衡轮廓点数据的学习。实验结果表明,本文所提出的方法能够对密集球团颗粒进行精准分割,F1-score达到 96.85%,整体优于其它对比方法,且粒度测量速度能够满足现场生产过程中的实时性要求。
优先出版时间:2025-04-16 DOI: 10.13195/j.kzyjc.2024.1396
摘要:本文针对四旋翼无人机轨迹跟踪过程中存在的速度测量值未知和多源干扰不确定性影响等问题,提出了一种基于自适应降阶GPEBO的复合非奇异快速终端滑模控制方案.首先,考虑系统的位置和姿态回路特性,在系统重新参数化之后构建线性回归方程来将系统的状态估计任务转化为参数估计;其次,通过引入动态回归扩展与混合理论设计有限时间收敛的自适应降阶GPEBO来重构速度测量值未知和估计集总干扰,接着,基于重构的状态构建动态非奇异快速终端滑模面并基于估计的集总干扰信息结合非奇异快速终端滑模控制器分别在位置和姿态回路设计有限时间收敛的复合非奇异快速终端滑模控制器.然后,采用基于Lyapunov方法证明了闭环系统的有限时间收敛.最后,仿真结果表明,所提方法相较于扩张状态观测器具有更快的收敛速度和更好的抗干扰能力.
优先出版时间:2025-04-15 DOI: 10.13195/j.kzyjc.2025.0021
摘要:针对大多数基于u-shapelet的时间序列聚类方法未能同时兼顾u-shapelet提取效率和质量的问题,提出了一种基于关键点引导的u-shapelet时间序列聚类算法UKey.首先,从时间序列数据集中随机采样一个时间序列子集.然后,采用所提出的两步法识别采样时间序列中的关键点.其次,利用这些关键点提取子序列以得到u-shapelet候选集.这一策略不仅确保所提取的候选子序列包含关键波动区域,还有效减少了候选子序列的数量.随后,引入Davies-Bouldin(DB)指数作为一种新的子序列质量评估方法,旨在通过综合考虑类间分离度与类内紧凑性,以确保所获取的u-shapelet集合具有较高的质量.最后,用k-Means算法对基于u-shapelet集合构建的距离矩阵进行聚类.在10个不同数据集上的实验结果表明,UKey算法的性能优于12种对比算法,具有较高的准确性和可解释性.
优先出版时间:2025-04-14 DOI: 10.13195/j.kzyjc.2024.1430
摘要:针对现有基于多源领域自适应的故障诊断方法未充分考虑不同源域信息质量的差异, 本文提出了一种基于可信多源领域自适应的跨域故障诊断模型 (TMDAFD). 首先, 构建了源域与目标域的最优公共嵌入空间, 实现了特征有效对齐? 其次, 基于主观逻辑 (SL) 理论, 设计了领域自适应模型不确定度量方法, 量化了不同源域数据对目标域诊断决策的可信度, 从而更准确地刻画了源域样本在目标域诊断任务中的作用? 最后, 依据所得的可信度量, 提出了信息融合策略, 有效地利用了多个源域的决策信息. 在凯斯西储大学 (CWRU)、江南大学 (JNU) 和渥太华大学 (UO) 的滚动轴承故障数据集上进行了实验验证, 结果表明, TMDAFD 模型在跨域故障诊断任务中显著提高了模型性能.
优先出版时间:2025-04-11 DOI: 10.13195/j.kzyjc.2024.1295
摘要:针对具有测量噪声和外部环境扰动的船舶,设计一种在线鲁棒自适应系统辨识方法,解决了缺乏持续激励条件下的模型辨识问题.基于双层积分滤波回归器设计了一种复合自适应更新律,实现对船舶所有参数、状态及初始状态值的在线估计,并自适应参数变化;采用扩展状态观测器估计系统总误差,并将其作为事件触发信号,以节约系统资源和监控系统精度.在初始激励条件下,所提出的系统辨识算法确保了所有估计误差全局一致最终有界.仿真结果表明,与现有算法相比,该方法在辨识速率和精确度上具有显著优越性.
优先出版时间:2025-04-11 DOI: 10.13195/j.kzyjc.2024.1415
摘要:本文从聚合博弈的角度研究了二阶多智能体系统的分组编队控制问题, 每个分组选定一个领导者, 为实现期望编队设计了博弈成本函数, 研究发现二次聚合博弈的纳什均衡可以构成领导者的期望编队. 此外, 本文设计了一种分布式算法, 使这些领导者通过寻求纳什均衡来形成期望的编队, 每个领导者对博弈的聚合函数进行估计. 进一步, 利用李雅普诺夫稳定性理论分析了算法的收敛性. 与现有的编队协议相比, 采用该算法的二阶智能体在不依赖邻居位置和速度信息的情况下收敛到期望的编队. 同时,跟随者采用了不同于领导者的控制协议, 通过调整相对于邻居和领导者的位置和速度, 最终形成了期望的编队. 最后, 本文通过一个仿真案例验证了上述理论结果的有效性和可行性.
优先出版时间:2025-04-11 DOI: 10.13195/j.kzyjc.2024.1425
摘要:针对逆变器中开关管微小故障引起的特征信号微弱、检测难度大的问题,提出一种在逆变器输出端提取相关故障特征参数并利用PCA方法实现故障检测的故障诊断方法。通过分析IGBT微小故障与逆变器输出电压波形之间的关系,选取暂态故障特征参数——超调量、峰值时间、峰值电压斜率以及稳态故障特征参数——输出稳态电压。通过划分时间片的方法,从逆变器输出电压中提取故障特征参数。在此基础上,利用PCA对故障特征参数样本进行分解得到主元空间和残差空间,计算两个空间中的统计量T2和SPE从而判断是否发生故障。仿真与实验验证结果表明,与现有方法相比,所提方法能够实现IGBT微小故障的精确诊断,具有良好的应用价值。
优先出版时间:2025-04-10 DOI: 10.13195/j.kzyjc.2024.1406
摘要:现有的粒子滤波器在解决未知但有界系统状态估计问题时, 普遍存在粒子需求量大和粒子退化问题, 影响状态估计的精确性. 本文设计了一种基于自适应萤火虫重采样的区间粒子滤波器. 首先, 通过宽度和估计误差计算每个区间的权重, 进而根据权重判断区间是否被舍弃. 其次, 在重采样步骤中引入自适应萤火虫优化策略, 通过求解优化后的自适应系数以确定每个粒子区间的移动方向和步长, 从而改进后验粒子区间分布. 此外, 进一步划分状态估计区间, 对所得的状态估计上下界进行迭代收缩, 以获得更小的状态估计区间边界和更准确的状态估计结果. 本文所提算法可以使得具有更高权重系数的区间能够更有效的包裹真实状态, 从而减少粒子需求, 且设计的自适应重采样策略能够显著降低粒子退化的程度. 最后, 通过数值仿真和 Buck-Boost 模型的实验, 验证了本文所提算法能够更紧致的包裹状态的上下界, 且具有更低的均方根误差, 表明本文设计的滤波器提高了状态估计的准确性, 提供了更紧致的状态包裹.
优先出版时间:2025-04-10 DOI: 10.13195/j.kzyjc.2024.1516
摘要:随着信息技术的不断发展,智能运维在工业设备的数字化转型过程中发挥着至关重要的作用。通过设计科学的运维策略,不仅保证复杂系统的高可用性和可靠性,而且降低企业运营成本和风险。不同于传统维修策略假设运行周期是无限的,为了设计出更加符合实际的运维策略,本文不仅在有限周期下考虑了预防性维修成本随运行时间发生改变的特点,并结合复杂系统在实际作业过程中同时受到退化失效和突发失效的双重影响,建立了一个有限周期下基于竞争失效系统的预防性维修优化模型。该模型以期望维修总费用最小化为目标,通过构建马尔可夫决策过程(Markov Decision Process,MDP) 并采用动态规划算法确定最优的检修间隔和维修策略。最后,通过数值算例结合敏感性分析验证了所提出动态运维策略在维修资源合理配置方面的有效性。
优先出版时间:2025-04-02 DOI: 10.13195/j.kzyjc.2024.1350
摘要:分布式能源广泛接入电网促使传统配电系统向园区级信息物理多微网过渡,针对分布式资源接入交直流混合微电网后子网间功率交互的问题,本文提出考虑自治-互济的多园区端网弹性协调控制策略,保证孤岛下园区系统电能质量。首先,考虑子微网净功率和功率互济时最大传输功率作为约束条件,将其划分为自治、过渡、互济三种运行模态,根据不同模态设计了储能的充放规则以及功率互济传输方向,给出具体的切换策略。然后在负荷端考虑重要负荷(critical load,CL)用电质量问题,将反步控制应用到电力弹簧保持重要负荷电压期望轨迹稳定跟踪;针对信息网络通信受阻问题,提出分布式一致性模型预测补偿控制方法。最后在MATLAB/Simulink 仿真平台验证了所提控制策略的有效性和准确性。
优先出版时间:2025-04-01 DOI: 10.13195/j.kzyjc.2024.1277
摘要:现有的不平衡数据回归算法需要多次计算样本间的距离,当样本数量较大时,处理效率较低.粒球模型可以将样本集合迭代划分为多个粒球,降低样本规模.但是,当前的粒球模型依赖于样本类别标签,不适合回归任务.本文利用粒球内样本区域的网格划分,定义粒球的填充度,提出了一种网格自组织粒球模型(GSOGB),能同时处理回归任务和分类任务;在此基础上,给出粒球内样本在邻域内的过采样策略,提出基于网格自组织粒球模型的不平衡回归方法(GSOGB-SMOTER).实验结果表明,本文提出的GSOGB在12个分类数据集上优于现有粒球模型,提出的GSOGB-SMOTER在10个不平衡回归数据集连续目标值域的5个等长分区的MSE指标上略优于文献中的7种算法,且具有鲁棒性和更高的运行效率,能快速处理较大规模数据的不平衡回归.
优先出版时间:2025-03-31 DOI: 10.13195/j.kzyjc.2024.1173
摘要:为了克服蜜獾算法收敛精度有时不高、易早熟收敛等缺点,增强其寻优性能及优化效果,提出一种多策略改进蜜獾算法(PSWHBA).首先将迭代过程划分为三部分,在不同的迭代时期选取不同的搜索策略,以更好地平衡勘探与开发.随后引入停滞门限值,一旦达到该阈值则执行多重变异更新策略,帮助个体跳出局部极值.最后对种群中的较差解进行基于模拟退火的小波变异学习,以提高整体种群质量,进而提升算法的收敛速度和寻优精度.为了全面评估PSWHBA的性能,将其与多个具有代表性的对比算法在IEEE CEC2022测试集上进行了仿真测试,包括寻优精度、收敛性能及与对比算法的差异性分析.实验表明,PSWHBA对于算法机制的改进具有明显的有效性,相较于对比算法具有明显的优越性,具备出色的寻优性能及稳定性.
陈彦杰, 范俊炜, 张丽萍, 江文圣, 赖镇南, 余洪山, 王耀南
优先出版时间:2025-03-31 DOI: 10.13195/j.kzyjc.2024.1280
摘要:移动机器人在执行未知目标收集任务时通常面临环境未知、目标信息缺失等挑战. 针对未知环境目标收集任务时容易忽视探索角落边界、过度拓展覆盖范围而产生的任务完成效率低、路径冗余等问题, 本文提出一种同时探索与覆盖的运动规划方法(Simultaneous Exploration and Coverage Path Planning, SECPP). 首先, SECPP算法通过由环境信息量与移动代价构成的信息增益函数, 从边界采样的候选探索点中选择信息增益最大的为实际探索点. 其次, 考虑机器人探索后地图信息的变化, 搭建平衡框架判断局部环境探明情况. 若局部环境未探明, 使机器人持续根据选定探索点执行环境探索任务. 若局部环境已探明, 提取任务区域信息, 通过由路径探索因子与覆盖引导点构成的覆盖奖励函数, 生成区域覆盖路径, 使机器人沿路径移动并同步执行目标采集, 实现区域目标的完全收集. 最后, 本文将SECPP算法与其他同类先进算法进行了仿真与实验对比, 结果表明SECPP能以更短的重复路径长度、更少的转角数量以及更短的时间完成未知目标收集任务.
优先出版时间:2025-03-31 DOI: 10.13195/j.kzyjc.2024.1401
摘要:本文研究了领导者线速度与航向角均为时变情况下,基于方位测量的编队控制问题。不同于传统基于方位的编队控制方法需要已知领导者完整且时变的速度信息,本文中领导者时变的线速度对于所有跟随者是完全未知的。为了保证目标编队的唯一性,考虑了nl个同步运动的领导者。根据以通信方式获得的领导者航向角与速度上界信息,本文为轮式机器人模型的跟随者设计了一种基于方位测量的编队控制律,实现了目标编队的期望几何构型。使用Lyapunov定理证明了闭环系统的渐进稳定性,仿真结果验证了所提出控制律的有效性。
优先出版时间:2025-03-28 DOI: 10.13195/j.kzyjc.2025.0058
摘要:为确保应急物资的持续供应和有效分配,使应急物资供应链在供应商失效时仍能保持一定的供应能力并快速响应,继而恢复到良好的运行状态,从而提升应急管理效率,本文将韧性理论引入自然灾害应急物资供应链决策中。基于韧性预防策略(产能储备与多源采购)、韧性响应策略(备用供应商)及韧性恢复策略(原供应商产能修复),在政企联合模式的前提下,建立以供应链总成本最小和供应链总韧性值最大为目标的两阶段混合整数随机规划模型。通过算例求解得到不同情景和多种不确定因素下的应急物资供应链相关决策方案,并通过对比分析和灵敏度分析证明模型的有效性与韧性策略的适用性。结果表明:韧性策略可以有效提升应急物资供应链应对供应中断的预防能力、响应能力与恢复能力;韧性预防策略更适用于供应链失效程度较小的情况;供应商失效时间越长、失效情景越严重,备用供应商发挥的作用越大,反之则原供应商产能修复发挥的作用更大。
优先出版时间:2025-03-28 DOI: 10.13195/j.kzyjc.2024.0968
摘要:随着电池技术的逐渐成熟和新能源的快速发展,电动汽车(Electrical Vehicle, EV)已成为未来电网的重要组成部分,其作为辅助调频资源的汇聚调度已成为当前研究热点.为了更好地管理和利用EV资源的潜力,聚合商应运而生.本文首先考虑了EV集群参与调频服务的主观意愿度与客观出行行为,研究评估得到EV集群的可调频容量,在此基础上讨论了聚合商参与日前市场(Electricity Day-ahead Market, DAM)竞价的策略,随后引入可信性理论描述竞标过程的不确定性,同时构建聚合商参与竞标的收益模型并改写,提出了一种基于可信性理论的三目标结构优化模型,最后采用NSGA-II算法对模型进行求解.仿真结果表明,该模型能够在为聚合商提供多样化的竞价策略选择的同时,提高其参与辅助调频服务的经济可行性和稳定性.
优先出版时间:2025-03-28 DOI: 10.13195/j.kzyjc.2024.1492
摘要:近年来交通运输业呈现出迅猛发展的态势。电动汽车由于可以减少环境污染并使得交通系统更加智能,得到了快速发展。然而由于电动汽车充电桩分布不均匀,导致出现了电动汽车里程焦虑问题。车-车能量互济装置(V2V)的研究成为了消除电动汽车里程焦虑的关键技术之一。V2V技术不仅可实现两辆电动汽车之间的电能传输,缓解电池续航不足与充电桩分布不均的问题,还能显著提升充电灵活性。本文对现有的车-车能量互济装置的拓扑结构和控制策略进行了全面讨论,首先分析了隔离型、非隔离型和无线传输型三类主要拓扑结构的工作原理和应用场景;进而探讨了对其线性和非线性控制策略的优缺点,并结合不同拓扑给出了优化建议。本文还扩展讨论了V2X技术的发展趋势,包括车-车(V2V)、车-家(V2H)、车-网(V2G)协同控制等多种应用场景在智能电网中的应用前景。最后讨论了V2V充电技术的商业化发展现状,商业化解决方案和面临的挑战。
优先出版时间:2025-03-28 DOI: 10.13195/j.kzyjc.2024.1142
摘要:针对燃气轮机信号监测过程中存在噪声干扰及特征冗余所导致的数据稳定性差、诊断效率低的问题,提出一种基于相似度的燃气轮机可诊断性分析方法.首先,通过多项式拟合得到运行数据的整体趋势,消除局部突变导致的噪声,计算得到噪声阈值,解决监测信号噪声干扰问题.然后,利用动态时间规整算法对燃气轮机不同运行状态下的数据进行相似度计算,得到独立性特征,构建可诊断性评价矩阵与故障特征矩阵,筛选燃气轮机最优特征组合故障特征,解决监测信号特征冗余问题.最后,将筛选得到的最优特征组合作为卷积神经网络的输入,建立故障诊断模型.利用燃气轮机典型气路故障数据对所提出的方法进行了实验验证,结果表明,所提出的方法有效地去除了冗余特征,具备良好的故障隔离性,准确率达到99.98%,相对原始特征诊断效率提升32.6%。
优先出版时间:2025-03-25 DOI: 10.13195/j.kzyjc.2024.1444
摘要:视觉惯性里程计(Visual Inertial Odometry,VIO)是卫星拒止环境下的高效导航定位方法,但由于传感器噪声和累计误差的存在,不可避免的产生漂移而影响导航定位精度。针对上述问题,本文提出了一种融合距离梯度的单目视觉-惯性-UWB紧耦合导航定位方法。通过构建超宽带(Ultra Wide Band,UWB)测距传感器的测量距离及其梯度信息的残差模型,利用因子图优化方法实现了VIO与UWB的信息融合,特别是距离梯度信息的引入,实现了速度信息的修正,从而以多传感器紧耦合融合的方式进一步抑制了导航系统的漂移并改善导航定位精度。所提出方法在EuRoc公开数据集以及实际的无人机平台上进行了多种飞行模式的实验验证,结果表明本文提出的方法具有良好的可行性和导航定位性能,与使用相同测量信息的同类方法比较,导航精度能够提升13.7%。
优先出版时间:2025-03-24 DOI: 10.13195/j.kzyjc.2024.1172
摘要:围绕海上基地的攻抗可看作一个多阶段序贯对抗过程,通常表现为不完美信息零和博弈. 针对海上基地防护安全博弈问题,构建不完美信息序贯博弈模型; 围绕近似纳什均衡策略的快速求解, 提出可配置反事实遗憾最小化(Configurable CFR, CogCFR)算法, 可动态控制CFR的超参数; 以海上多个海上基地防护为试验背景,利用CogCFR求解海上基地防护资源分配策略. 针对有限理性对手,提出了考虑约束的单侧信任域鲁棒对手利用策略更新方式. 实验结果表明,可配置反事实遗憾最小化相比动态加权反事实遗憾最小化计算时效性更强、参数更少. 算法具有较好的应用可行性和领域泛化性,可为序贯交互类博弈对抗问题策略求解提供参考.
优先出版时间:2025-03-24 DOI: 10.13195/j.kzyjc.2024.1185
摘要:一致分数阶灰色多变量卷积(CFGMC($\alpha$,N))模型在传统的灰色多变量(GM(1,N))模型基础上引入了一致分数阶导数和常数项, 不仅体现了信息的差异性对数据发展趋势的影响, 还实现了与经典GM(1,1)模型的兼容性. 然而CFGMC($\alpha$,N)模型存在驱动因素累加阶数单一、结构简单、微分方程与差分方程之间的转换误差等缺陷. 为此, 本文对因变量和自变量一致分数阶累加的阶数进行差异化分析, 同时引入了非线性校正项并借助于离散灰色模型的思想以消除转换误差, 构建了一种可变一致分数阶非线性离散灰色多变量模型, 分析了新模型的基本性质, 给出了最优累加阶数的计算方法. 利用该模型对油气管道腐蚀速率进行分析, 结果显示新模型的拟合和预测精度明显优于经典的GM(1,N)模型、CFGMC($\alpha$,N) 模型等其他几种灰色多变量模型.
优先出版时间:2025-03-24 DOI: 10.13195/j.kzyjc.2024.1376
摘要:本文探讨基于衰减网络的Markov 跳变系统通信调度概率和控制器协同设计问题. 具体来说, 在每个传 输时刻只能通过网络传输一个信道的衰减信号, 该信号由传感器的测量信号经过衰减网络传输到控制器. 引入随 机通信协议对信道选择进行调度. 随机通信协议的信道选择和衰减网络中的衰减系数均建模为Markov 模型. 通 过Lyapunov 方法, 推导出同时满足闭环系统指数均方稳定和预设H∞ 性能的充分性条件. 然而, 得出的系统稳定 性和控制器设计条件存在非线性和非凸约束. 为了解决非线性约束并且获得最佳的闭环系统H∞ 性能, 本文提 出一种带有惩罚约束的遗传算法与线性矩阵不等式方法相结合的迭代算法, 并给出该迭代算法初始值的选择方 案. 最后, 本文例子部分论证了所提控制方法的有效性.
优先出版时间:2025-03-24 DOI: 10.13195/j.kzyjc.2024.1380
摘要:数据驱动的进化算法(DDEAs)能够从历史数据中建立模型来指导种群优化,它克服了传统进化算法难以应用在计算密集型且昂贵, 机理复杂无法建立数学模型等问题的局限性, 因此引起了广大学者的关注. 然而,DDEAs 面临两个困难,首先构建高质量的代理模型需要使用复杂的模型管理策略,这虽然提高了算法的性能但也增加了算法的运行时间.其次,径向基函数网络(RBFN)作为一个被广泛应用在DDEAs中的模型,却少有研究来根据不同的问题来选择合适的超参数.为此,本文首先提出了一种预选择策略,该策略可以通过复杂度低的粗糙模型将种群快速的迭代到最优解附近,其次,提出了一种基于肯德尔相关系数的模型排序置信度指标并利用该指标设计了一种选择策略,该策略能从几种RBFN超参数中选择选择出最适合当前问题的超参数.基于以上两点并结合堆栈泛化的集成方法提出了基于预搜索和模型选择的DDEAs(DDEA-PMS).与6个最新的DDEAs在基准问题上的实验结果表明,所提出的DDEA-PMS能以较少的时间开销产生具有明显优势的结果
优先出版时间:2025-03-22 DOI: 10.13195/j.kzyjc.2024.1345
摘要:针对传统灰色关联分析模型无法测度因素间交互作用且未考虑数据噪声的问题, 基于奇异值分解提出了灰色交互作用关联分析模型. 通过引入交互作用矩阵, 利用奇异值分解方法, 结合贡献率准则确定关键奇异值, 构建了单一因素和交互作用的灰色关联系数, 并最终得到单一因素和考虑交互作用的灰色关联度. 所提出的模型满足规范性、对称性、数乘变换不变性等性质, 并克服了对象排列顺序对关联度的影响. 最后, 将模型应用于黄河流域碳排放单一因素和交互作用驱动因素分析, 识别出关键影响因子, 结果表明了模型的合理性和有效性. 通过稳定性和置换检验分析, 进一步验证了模型的稳健性.
优先出版时间:2025-03-21 DOI: 10.13195/j.kzyjc.2025.0076
摘要:为充分利用码头资源,减少集卡在港时间,缓解港口内的码头拥堵问题,考虑闸口与堆场作业的相互影响,将集装箱码头集疏港作业视为两阶段混合流水作业,优化集卡作业指派与顺序。将集卡视为工件,每个集卡都需要依次经过第一阶段闸口作业和第二阶段堆场作业,完成集卡进港提/送箱作业。考虑堆场作业中作业安全距离、场桥不可跨越等现实约束,建立基于混合流水作业组织的码头集疏港作业调度优化模型。结合问题特点设计搜索算子,应用了基于Q-learning的改进变邻域搜索算法进行求解。数值实验验证了所提出算法的有效性,将所提出策略与传统策略进行对比,结果显示:所提出的基于混合流水作业组织优化的方式能够降低17.78%设备间作业时间不平衡度,并降低3.70%集卡最大流程时间。
优先出版时间:2025-03-20 DOI: 10.13195/j.kzyjc.2024.1140
摘要:本文针对带有非对称死区输出的1/4主动悬架系统的跟踪控制问题, 提出了一种自适应模糊非奇异有限时间控制方案. 首先, 使用基于预设性能函数的误差转换方法对全状态跟踪误差进行约束, 在避免控制器设计中的“奇异值”问题的同时, 保证了车辆驾驶过程中的舒适性与安全性. 然后, 结合自适应算法利用模糊逼近引理对系统中存在的未知非线性函数以及因非对称死区输出带来的不确定项进行模糊逼近; 接着, 将非线性滤波器与反步法相结合, 避免了反步法中可能出现的“微分爆炸”问题; 随后, 利用对称障碍李雅普诺夫函数方法验证了车身子系统的有限时间稳定性后, 对1/4主动悬架系统进行了零动态性能分析, 得到了悬架空间限制条件; 最后,通过仿真实验对所设计控制方案的有效性进行了验证.
优先出版时间:2025-03-20 DOI: 10.13195/j.kzyjc.2024.1187
摘要:为了实现精确的电流跟踪控制,提出了一种基于自组织递归情感神经网络的APF 分数阶快速终端滑模控制方法。首先,针对APF 系统,设计了一种分数阶快速终端滑模控制器,由于分数阶的存在引入了更多的自由度,使得系统更具有适应性和鲁棒性。其次,基于大脑情感学习模型和尖峰自组织机制构建并介绍了一种新颖的类脑神经网络SORENN,以此解决分数阶快速终端滑模控制器依赖于精确系统参数的问题,从而提升其控制性能。同时,与其他的一般神经网络相比,SORENN 由于尖峰自组织机制的加入,解决了普通神经网络无法在线进行网络结构更新的问题,实现了网络结构的在线优化并且减轻了计算负担,从而提高了网络的学习速率和逼近能力。之后,依据Lyapunov 稳定性定理对此控制方法的稳定性与收敛性进行了证明。最终,通过对该混合智能控制方法进行诸多仿真与实验研究,揭示了其卓越的控制性能。
优先出版时间:2025-03-20 DOI: 10.13195/j.kzyjc.2024.1335
摘要:针对直升机系统存在的执行器故障和不确定性问题, 提出一种基于宽度神经网络的预设时间容错控制方法. 首先建立直升机的全状态方程, 结合预设时间及动态面控制实现直升机的预设时间稳定控制. 同时, 设计宽度神经网络对模型中的故障和不确定项进行估计, 并通过增加特征节点和增强节点的方式提高网络估计精度. 然后, 基于估计值对控制项进行补偿, 得到执行器故障或不确定情况下的自适应控制律. 最后通过仿真实验验证了所提出方法的有效性.
优先出版时间:2025-03-17 DOI: 10.13195/j.kzyjc.2024.1326
摘要:针对非线性动态工业过程建模中易产生信息冗余和时序信息衰减问题,提出一种基于双流记忆调节门控循环单元并内嵌双阶段注意力机制的动态软测量算法。一方面,设计时间相关和动态因果相关的双流信息提取结构,在门控循环单元中分别引入时间门和因果门,提取信息中的时序关系与动态因果关系,从而形成互补信息流,提高模型的预测性能;另一方面,在特征提取和预测输出阶段分别引入特征注意力和时序注意力机制,以动态挖掘输入特征与目标特征间的潜在相关性,捕捉关键特征,并评估不同历史时间点对于待预测时刻的重要程度,从而选择关键时间点信息;最后,通过数值仿真以及某火电厂脱硫过程排放烟气SO2浓度的软测量验证所提算法的预测效果。
优先出版时间:2025-03-17 DOI: 10.13195/j.kzyjc.2024.1339
摘要:针对目标跟踪算法在长期跟踪场景下对目标尺度变化缺乏适应性,以及跟踪目标小,遮挡与相似物干扰等问题,提出一种新的具有动态感受野的双模板分支跟踪算法(Static-Dynamic Template Tracker,SDT-Tracker)。首先,引入并行注意力机制对ResNet50进行重新设计,构建一种具有动态感受野的特征提取网络进行高效特征提取。其次,设计3种下采样方式进行降采样,通过融合局部特征、原始特征和关键特征,实现多角度特征捕获,减小特征信息的损失。最后,提出一种动静态双模板分支跟踪策略,动态分支持续引入后续帧信息,而静态分支提取目标初始信息,在关键帧时刻抑制动态分支引入的无关信息,进而减少相似物干扰和遮挡造成的负面影响。在LaSOT、OTB100数据集上进行算法验证,实验结果表明算法的有效性和优越性。之后将算法移植到嵌入式设备Jetson Xavier NX上进行性能测试,运行速度达24帧,相较于经典目标跟踪算法,本文方法在多种复杂场景下具有更高的精度,且能有效解决相似物干扰、遮挡等问题。
优先出版时间:2025-03-14 DOI: 10.13195/j.kzyjc.2024.1375
摘要:本文提出一种基于扰动估计和无微分模型参考自适应控制 (Derivative-free model reference adaptive control, DF-MRAC) 的钻柱振动抑制方法,克服地层变化对钻柱振动抑制的影响。首先,设计一种基于扰动估计和无微分模型参考自适应控制的钻柱振动抑制方案,处理状态相关的钻头—岩石作用扰动对钻柱振动抑制的影响。通过广义扩张状态观测器 (Generalized extended state observer, GESO) 估计包含地层信息的钻头—岩石作用扰动。然后,将没有钻头—岩石作用扰动的钻柱振动模型作为参考模型,进行基于扰动估计和无微分模型参考自适应控制方法的钻柱振动抑制控制器参数设计,克服地层变化对钻柱振动抑制的影响。最后,通过仿真实验说明所提方法在处理地层变化对钻柱振动抑制影响方面的有效性,所提基于DF-MRAC的钻柱振动抑制方法相比GESO和MRAC方法能更加快速和稳定抑制钻柱振动。
优先出版时间:2025-03-12 DOI: 10.13195/j.kzyjc.2024.1364
摘要:逻辑动态系统指自变量只取有限个值的动态系统, 包括2值的经典逻辑(或布尔逻辑)、k值逻辑、(一 般)混合值逻辑, 网络拓扑结构是影响网络性能和可靠性的关键因素之一. 本文旨在从多个角度对逻辑动态系统 拓扑结构的相关研究作一简要分析与总结. 首先, 从动态演化的角度, 本文概述了同步布尔网络、异步布尔网络、 随机布尔网络中关于吸引子的研究方法, 主要包括模拟方法、BDD技术、分解方法、反馈顶点集方法等. 其次, 从结构矩阵的角度, 本文总结了在代数状态空间表示的框架下, 求解吸引子与吸引域的具体算法, 体现了矩阵半 张量积在求解拓扑结构中的优越性. 最后, 从图的角度, 简要总结了基于接线图、状态转移图、网络删节、网络 划分等解求吸引子的方法.
优先出版时间:2025-03-12 DOI: 10.13195/j.kzyjc.2024.1514
摘要:不当超车行为是造成高速公路交通事故的主要原因之一.针对超车场景中状态机模型设计难度大且泛化性不足的问题,本文引入动态非合作博弈模型分析车辆间的交互行为,并考虑驾驶员不同风格搭建了超车决策模型.首先,通过因子分析法和K-means聚类法将驾驶员划分为激进型、普通型和保守型三种驾驶风格.然后,引入Stackelberg博弈论描述自车与障碍车的交互,构建包含安全、舒适和通行效率的博弈成本函数,结合不同驾驶风格求解最优超车决策.此外,研究了考虑不同驾驶风格影响的五次多项式换道轨迹,建立了满足多需求的决策评价函数,求解出不同驾驶风格组合下的最优换道时间.最后,通过PreScan和Simulink联合仿真验证了该决策模型在多场景下的有效性,旨在帮助智能车辆做出拟人化的超车决策,提高通行效率和行车安全.
优先出版时间:2025-03-12 DOI: 10.13195/j.kzyjc.2024.1006
摘要:在多无人机多目标的森林火灾救援侦察场景下,针对任务规划问题复杂度高、任务规划速度和任务执行效率难以平衡的问题,提出了一种面向多目标侦察的多无人机分层任务规划方法. 该方法对任务规划问题进行适当解耦以降低复杂度,将任务规划分为航迹规划、任务目标分配和任务序列规划三部分. 提出基于状态空间采样规划和Dubins曲线的航迹规划算法,考虑无人机动力学约束,为后续步骤构造任务节点连通图,生成可行航迹集;在任务目标分配阶段进行谱空间转换,基于目标群划分的非线性特性,通过谱聚类实现快速目标分配;提出结合分支定界法和模拟退火算法的混合优化算法实现任务序列规划,结合可行航迹集生成任务执行航迹. 该方法针对任务规划问题设计解耦算法,能够快速规划出较好结果. 与其他任务规划方法进行仿真对比实验,结果表明该方法任务规划结果航迹长度更短、规划耗时与任务耗时更少,并且航迹满足动力学与禁飞区约束.
优先出版时间:2025-03-08 DOI: 10.13195/j.kzyjc.2024.1452
摘要:随着无人系统技术的快速发展, 其在高精度、高风险及复杂环境任务中的应用日益广泛. 然而, 无人系统在实际应用中面临诸多优化挑战, 如轨迹规划与跟踪、编队控制、决策与任务分配以及控制优化等. 传统优化方法在处理这些复杂问题时往往力不从心. 本文基于神经动力学优化的无人系统若干问题研究现状, 重点介绍了几类神经动力学优化方法, 探讨了其在无人系统优化问题中的独特优势. 随后详细分析了无人系统中几类关键优化问题的数学特性与难点, 并总结了神经动力学优化方法在这些问题中的具体应用与成效. 最后, 本文展望了神经动力学优化方法在无人系统领域未来的发展方向, 强调了其在提高无人系统性能、安全性和智能化水平方面的重要作用.
优先出版时间:2025-03-08 DOI: 10.13195/j.kzyjc.2024.1355
摘要:在“双碳”目标的推动下, 新能源和新型负荷的大规模接入为电力系统协同优化调度带来了新的挑战.多智能体系统中的分布式协同优化方法以其低实施成本、高可扩展性、鲁棒性以及隐私保护等优势, 提供了应对新型电力系统协同调度问题的创新解法. 本文对国内外分布式协同调度算法的最新理论进展进行了系统综述, 阐明了分布式方法相较于集中式方法的优势. 特别是从网络结构的角度, 重点分析了无向图和有向图下各类分布式协同优化算法的基本原理、优势与局限性. 此外, 本文还探讨了新型电力系统协同调度在分布式网络下面临的通信、可再生能源和负荷的不确定问题和现有的解决方案, 以及一些非凸协同调度模型的数学描述. 基于现有研究结论对新型电力系统协同调度的发展趋势进行展望, 为该交叉领域的研究者提供了更全面的信息和新的研究视角.
优先出版时间:2025-03-07 DOI: 10.13195/j.kzyjc.2024.1045
摘要:信息物理系统(Cyber-Physical Systems, CPSs)的网络安全问题日益突出. 为确保CPSs的安全运行和数据可靠性, 研究了无人水面船艇(Unmanned Surface Vessels, USVs) 在拒绝服务(Denial-of-Service, DoS)攻击和虚假数据注入(False Data Injection, FDI)攻击下的分布式分阶弹性状态估计问题. 首先, 提出了一种基于随机加密技术的隐私保护模型, 分析了在FDI和DoS联合攻击以及FDI双通道攻击的不同场景下, 攻击对估计误差和系统估计性能的影响. 其次, 为了抵御FDI 攻击, 数据在整个通信过程中都进行了加密处理. 为了防御DoS攻击, 提出了一种加密补偿机制. 开放的网络环境使USV在数据传输过程中会遭遇联合攻击, 这些攻击威胁到系统状态的真实性. 为此,构造了一种分布式分阶弹性状态系统来抵抗联合攻击, 保证获得CPS的真实状态. 最后, 通过对无人水面船艇的速度状态的仿真和对比实验, 验证了所提方法的有效性.
优先出版时间:2025-03-07 DOI: 10.13195/j.kzyjc.2019.0930
摘要:针对执行空间重复任务的旋转电机系统, 本文提出一种基于李雅普诺夫方法的有限空间重复学习控制方法. 通过引入空间微分算子, 实现旋转电机系统模型由时间域表达到空间域表达的转换, 将以时间为自变量的旋转电机模型转换为以转子角位置为自变量的旋转电机模型. 在此基础上, 根据旋转电机在空间运行的周期重复特性, 将系统不确定分为固有的空间周期不确定和其他不确定两部分, 并构造全限幅空间重复学习律对空间周期不确定进行精确补偿. 同时, 设计有限空间控制律和鲁棒控制律, 使旋转电机的角速度跟踪误差能够在电机转子转动有限角度范围内收敛至原点附近邻域内, 实现旋转电机的角速度对期望角速度的快速、高精度跟踪. 最后, 基于李雅普诺夫定理证明闭环系统跟踪误差在有限空间内收敛至原点附近邻域内, 并给出实验结果验证所提控制方法的有效性.
优先出版时间:2025-03-07 DOI: 10.13195/j.kzyjc.2024.1327
摘要:随着国内城轨列车普遍加装轴箱振动传感器,基于振动信号的车轮退化状态检测成为地铁运维的新需求。受路基病害、变载荷及测量误差等因素影响,振动信号易受不规则噪声干扰,导致退化状态识别精度较低;同时,新列装车辆数据不足,退化趋势表征困难,检测模型鲁棒性不足。为此,本文提出了一种鲁棒无监督张量域适配网络,通过跨车辆车轮退化信息迁移来提升状态评估效果。首先,利用深度卷积自编码网络提取源域与目标域的深度特征,采用张量Tucker分解获得核心张量,通过最小化两域核心张量间的最大均值差异损失及张量化趋势性损失来进行领域适配;接着,建立交替优化算法,交替进行张量分解与领域适配,得到最优核心张量及公共退化特征表示;最后,基于退化特征的第一主成分构建健康指标(health indicator, HI),并根据HI曲线的凹凸性识别退化拐点。实验基于国内某地铁六号线的实测数据,结果表明,该方法能够有效实现车轮退化信息迁移,且鲁棒性强、识别精度高,为地铁跨线跨车运维提供了新的解决方案。
优先出版时间:2025-03-07 DOI: 10.13195/j.kzyjc.2024.1160
摘要:早期微小故障往往表现为数据分布变化不明显,并且高维数据下变量共线性的存在会导致样本协方差矩阵高度病态甚至奇异,因此传统基于规范变量分析的方法面临难以求解协方差矩阵的逆且无法及时检测到微小故障的难题. 针对上述问题,本文提出一种融合概率信息与稀疏规范变量分析(PSCVA)的微小故障检测方法.首先,在求解规范变量时施加L0约束,利用混合整数二次优化方法(MIQO)对数据矩阵进行分解以获得稀疏规范变量,其增强了变量间潜在关系的直观理解并有助于发现关键故障变量. 其次,利用正常阶段获得的稀疏规范变量构造规范向量、残差向量以及规范变量残差三种统计量,进一步考虑正常样本与故障样本之间的概率分布差异,引入 Wasserstein距离构造概率化的故障检测指标,以提高微小故障的检测性能. 此外,采用核密度估计确定非高斯分布数据下统计指标的控制限. 最后, 通过田纳西伊斯曼(TE)化工过程和连续搅拌反应釜(CSTR)系统的案例研究结果表明, 相较于CVDA和PCVDA, 在TE过程中所提方法的检测率分别提高 了136.72%和33.48%, 在CSTR过程的早期微小故障检测中分别提前106和60个样本预警到故障.
优先出版时间:2025-03-07 DOI: 10.13195/j.kzyjc.2024.1078
摘要:本文研究考虑执行器故障与控制输入饱和的不确定机器人系统高性能轨迹跟踪控制问题,提出一种基于非奇异终端滑模控制框架的固定时间预设性能容错控制器.首先,设计了一种新颖的固定时间预设性能函数,同时保证机器人轨迹跟踪位置误差稳态精度与瞬态性能的状态约束要求.然后,基于设计的改进预设性能函数与非奇异终端滑模控制策略,提出一种考虑执行器部分失效故障与输入饱和非线性的固定时间预设性能容错控制方法,保证闭环系统具有更快的瞬态响应性能、更高的稳态精度以及更强的鲁棒性.其次,利用Lyapunov稳定性理论证明了机器人轨迹跟踪位置误差的固定时间稳定性,同时满足设定的预设性能.最后,通过双关节机器人仿真算例与实验验证了所提方法的正确性与有效性.
优先出版时间:2025-03-07 DOI: 10.13195/j.kzyjc.2024.1309
摘要:在供应商给下游零售商提供多级销售目标返利合同的背景下,构建了由资金充足供应商和资金约束零售商组成的二级供应链,探究了零售商面对随机需求和两等级销售返利时的库存与融资决策。研究发现,销售目标在一定的范围内时,销售返利会激励零售商增加订货量且会促使资金不足的零售商融资补货达到目标库存;过大的销售目标会降低零售商的订货量,此时零售商资金过剩但不订货。数值分析表明,相较于线性返利模式,销售目标返利能够提高供应链利润。存在零售商刚好订货至销售目标阈值的“跟订区域”,该区域可以实现供应链双方利润的帕累托改进,零售商的库存决策不受自有资金的影响。供应商应通过销售目标返利激励零售商订货以实现长期合作,且可以根据零售商订货量反向识别其资金实际状况。
优先出版时间:2025-03-05 DOI: 10.13195/j.kzyjc.2019.0758
摘要:针对传统滚动轴承故障诊断方法中单信道振动数据分析导致的故障特征提取不充分、诊断精度受限的问题,提出了一种基于改进人工蜂群算法的多元变分模态分解(IABC-MVMD)与精细复合多元多尺度模糊熵(RCMMFE)相结合的多元故障信号诊断新方法。为克服MVMD分解过程中分解层数与带宽平衡参数难以自整定对诊断精度带来的影响,设计了一种融合Chebyshev混沌映射、精英信息引导、自适应惯性权重的改进人工蜂群算法(IABC),满足了多元激励信号在频域内的自适应剖分需求。在此基础上,使用RCMMFE构建能够全面表征轴承状态的高维故障特征集,并将其输入支持向量机中进行故障诊断。通过CWRU数据集上的仿真验证并与现有方法的对比分析,结果表明,所提方法能够高效准确地提取与识别滚动轴承的多元故障信号特征,具有较好的理论价值与实践意义。
优先出版时间:2025-03-05 DOI: 10.13195/j.kzyjc.2024.1042
摘要:随着客户对“门到门”运输服务需求的增长及对物流费用敏感度的提升,多式联运经营人亟需提供高效经济的集装箱全程运输服务.鉴于集装箱全程运输链涵盖多种运输资源和环节,多式联运经营人面临如何合理调配运输资源和实现各环节间有效协同的挑战.本文综合考虑集装箱干线运输和两端接驳环节,研究集装箱多式联运全程运输路径与接驳集卡调度的协同优化问题.基于集装箱运输时空网络,本文构建以总运营费用最小为目标的混合整数线性规划模型,并通过逻辑Benders分解算法框架设计可有效处理实际规模问题的精确求解算法.选取西部陆海新通道部分运输网络为实验场景,验证结果表明:相较于Gurobi商业求解器,所提算法在多种规模算例中求解效率更优;与传统的独立决策方法相比,本文的协同优化模型能够降低5%至7.5%的总运营费用.
优先出版时间:2025-03-05 DOI: 10.13195/j.kzyjc.2024.1278
摘要:针对灰色关联分析对非等间隔含噪序列数据精度低或不适用等问题, 提出从含噪数据重构本征函数及其高阶导函数的惩罚样条光滑法, 以弱化序列数据分布间隔和观测误差的影响, 设计能够综合静态关联性与动态关联性的函数型关联度, 并论证其规范性、接近性、分解形式和实践应用准则. 将模型应用于火炮身管烧蚀磨损截面特征分析实例, 结果表明该方法能够准确辨识烧蚀磨损截面与弹丸初速减退间的关联关系, 优于对比模型, 验证了方法的可靠性和有效性.
优先出版时间:2025-03-05 DOI: 10.13195/j.kzyjc.2024.1392
摘要:无人机飞行高度的动态变化使得航拍图像中往往包含大量小目标,同时目标尺度变化显著,这些问题给目标检测任务带来了挑战.针对上述问题,本文提出了一种基于多尺度融合和高分辨特征增强的无人机航拍目标检测方法.首先,在骨干网络中引入了多尺度结构重参数化特征提取模块,利用普通卷积块和结构重参数化的大核卷积块对多个分支进行不同尺度的卷积运算,有效提取了不同感受野下的特征信息.然后,在颈部网络中引入了基于特征金字塔网络的多维特征自适应融合模块,以优化其自下而上的特征聚合过程,实现对浅层特征中的精细细节和深层特征中的上下文信息的自适应选择,从而更有效地应对目标尺度显著变化.最后,在颈部网络中引入了多尺度特征融合小目标增强模块,来捕捉无人机航拍图像中小目标物体在不同尺度上的变化.在VisDrone2019 和TinyPerson 两个公开数据集上进行了大量的实验,证明了本文方法的有效性和优越性.
优先出版时间:2025-03-02 DOI: 10.13195/j.kzyjc.2024.1212
摘要:针对第一方内容和第三方内容存在的两种关系 (互补或替代), 本文构建理论模型, 深入研究第一方内容 不同投资类型对第一方和第三方内容价格和质量的影响机制, 以及对数字内容平台和第三方内容提供商收益的 影响机理. 主要研究结论如下:(1) 相较于平台不投资第一方内容, 当投资效率较高时, 平台投资互补的第一方内容 能促使第三方内容质量、价格及需求的增大; 当投资效率较低时, 此举会使第三方内容质量、价格及需求降低; 而 平台投资替代的第一方内容一定能促使第三方内容质量、价格及需求的增大;(2) 在适当的时机, 平台采用高质量 低价格的互补第一方内容或低质量高价格的替代第一方内容策略更有利于平台生态的可持续发展;(3) 投资互补 的第一方内容对平台总是有利, 但不一定有利于第三方内容提供商利润的增长; 而投资替代的第一方内容总有利 于两方利润的增长, 且竞争强度越大越有利于两者的利润增长.
优先出版时间:2025-03-02 DOI: 10.13195/j.kzyjc.2019.1158
摘要:针对优化融合图像的空间细节和光谱细节问题,本文提出一种双二阶注意力空谱细节补偿的 FCN.网络分别从高光谱图像和多光谱图像中提取光谱特征和空间特征,并将双模态特征融合,同时注重在细节补偿的约束下将融合后的特征重构为所需高空间分辨率高光谱图像.本文提出的双二阶注意力残差模块侧重提取图像的空间细节信息和通道细节信息.通过通道梯度表征通道关系的二阶统计量提取通道结构特征.利用物理可解释的图像结构张量表征空间关系的二阶统计量捕捉图像的高频细节.并对损失函数增加拉普拉斯损失与光谱角映射损失来进一步提高融合图像与参考图像的纹理与光谱相似性.本文在两组模拟数据集上进行了融合实验,与多种方法进行实验对比分析,并从分类角度间接验证融合图像的质量.结果表明:本文方法的融合图像在各指标上的性能最佳.融合图像的分类精度能够间接反映本文网络具有良好的融合效果.在两组真实数据集上的实验进一步验证了本文方法具有良好的泛化能力.
优先出版时间:2025-03-02 DOI: 10.13195/j.kzyjc.2024.1256
摘要:机器人柔顺控制在物理人机协作中扮演重要角色,但环境的不确定性可能影响交互的稳定性,特别是机器人与环境之间的接触失效可能导致物理冲击行为,进而造成机器人和任务组件的损坏.针对此问题,本文提出了一种能量功率受控的机器人笛卡尔空间阻抗控制方法.该方法通过缩放控制器刚度和阻尼限制机器人的能量和功率,并引入能量罐提供能量存储机制,确保控制器和机器人之间的能量传输符合无源性要求.在此基础上,设计功率缩放因子调节能量罐与控制器之间的能量交换速率,限制控制器流向机器人的功率,避免因能量罐的快速释放导致系统失稳,进一步提高了机器人执行任务的安全性和控制器的鲁棒性.基于李雅普诺夫理论严格证明了闭环系统的稳定性,并通过MATLAB/ SimScape仿真实验验证所提出控制方法的有效性.
优先出版时间:2025-03-02 DOI: 10.13195/j.kzyjc.2024.1344
摘要:多维分类问题中的类别变量具有复杂的依赖关系,这对分类性能有着重要影响. 分类器链算法能够有效地建模这些依赖关系,但由于标签顺序选择和错误传播问题,性能提升受限.为此,本文提出了一种基于分解排序的多维分类器链算法.该算法首先通过一对一分解规则将多维分类问题转化为多个二类分类任务,以降低问题的复杂度?其次,将标签顺序建模为线性排序问题,并利用遗传算法进行优化,确保标签排序的合理性?最后,通过控制特征空间策略减弱前序分类器错误预测对后续分类器的负面影响,从而提高算法的鲁棒性.在10个真实的多维分类数据集上进行的对比实验表明,本文所提的算法在泛化性能上优于当前先进的多维分类算法,同时具有较低的计算复杂度.
优先出版时间:2025-03-02 DOI: 10.13195/j.kzyjc.2024.1292
摘要:不确定性广泛存在于各种自然和工程系统中, 这对系统动力学的建模、分析、预测和控制提出了巨大的挑战. 对于工程控制系统,已经发展出了鲁棒控制相关理论以研究不确定性对系统动力学的影响及其综合设计问题. 然而,对于大规模人在环路(Human-in-the-loop)的集群自主系统,不确定性下的系统动力学研究仍处于起步阶段. 本文将经典控制系统中鲁棒控制的概念和方法扩展到大规模集群自主系统,提出了鲁棒博弈动力学的分析和综合方法,针对三类典型的不确定性研究了系统的演化动力学,并结合经济学、心理学、社会学中的期望效用理论探讨了博弈群体对不确定性的主观响应. 不确定性可以逆转经典博弈动力学的演化方向以及产生多稳态和周期振荡极限环等丰富的动力学行为. 本研究揭示了不确定性对集群自主系统演化的重要影响以及群体博弈系统动力学的复杂性.
优先出版时间:2025-03-01 DOI: 10.13195/j.kzyjc.2024.1431
摘要:智能工业化的迅速发展推动了技术设备的持续创新,随之而来产生了大量的实时数据流。在这些数据流中,数据的统计特性随时间可能发生变化,这一现象被称为概念漂移。概念漂移对机器学习模型的性能产生显著影响,未能及时识别和应对会导致模型性能的逐步下降,进而引发错误决策,从而在工业应用中造成不可忽视的损失。本文从工业应用的角度出发,总结了目前概念漂移检测与适应的研究进展。首先,本文聚焦于有监督环境下的工业概念漂移检测方法,从基于性能、窗口技术和集成方法角度详细总结了相关技术的发展现状。其次,针对工业场景中常见的标签稀缺问题,系统介绍了半监督学习和无监督学习在工业概念漂移检测中的应用方法。此外,本文还讨论了工业环境中普遍存在的不平衡类问题对概念漂移检测的影响,并综述了解决这一问题的相关策略。最后,针对工业环境下的概念漂移的适应方法进行了总结,并提出了未来研究的方向,以进一步提升概念漂移检测方法在复杂动态环境中的表现。
优先出版时间:2025-02-28 DOI: 10.13195/j.kzyjc.2024.1274
摘要:突发事件应急决策过程中, 决策者常因判断矩阵信息缺失而对其他决策者偏好产生移情效应, 且个体间偏好信息冲突阻碍共识达成. 针对残缺判断矩阵群决策问题, 现有方法往往忽略了挖掘高质量的额外信息来辅助决策, 有限的信息降低了决策结果的可靠性. 此外, 传统研究中矩阵补全与共识达成过程相互独立, 且反馈机制中难以识别出决策个体的冲突偏好, 影响共识达成效率. 为了克服以上问题, 提出了一个移情网络下同步实现矩阵补全和共识达成的群决策框架. 该框架首先有效整合间接偏好信息和移情偏好信息构建了有序回归共识判别模型; 其次, 通过设计冲突反馈机制, 分别构建了冲突信息最小成本剔除和调整共识模型. 本方法不仅深入挖掘了有效的隐性信息, 还促进了残缺值补全、共识达成与加性一致性实现的有机融合, 提升了应急决策过程中估计值的可信度和共识达成效率. 最后, 通过台风灾害应急案例、仿真和对比分析验证了所提框架的有效性.
优先出版时间:2025-02-27 DOI: 10.13195/j.kzyjc.2024.1138
摘要:移动机器人的路径规划与避障问题已成为近年来的研究热点。现有的基于深度Q网络算法在RPP问题上取得了一定的效果。然而,该算法在训练过程中存在着动作选择随机性过大,收敛速度慢等问题。此外,现有的算法较少涉及动态环境的定量分析。本文提出了一种基于双深度Q网络的路径规划算法,设计了一种特别的时序输入结构,能够采集更加丰富的动态语义信息,更好适应动态场景的路径规划。另外,本文设计了一种独特的经验分配策略。这种策略可以在不同的训练阶段分配不同经验池中的经验,以改善网络的训练效率。最后在静态和动态环境中对本文提出的算法进行了验证。与改进前的方法的相比,本文提出的方法训练时间减少了50%,路径规划的成功率提高了9.6%。
优先出版时间:2025-02-26 DOI: 10.13195/j.kzyjc.2024.1229
摘要:针对约束多目标进化算法存在难以平衡种群收敛性与多样性的问题,本文提出了一种基于平均矢量角和动态缩减机制的约束多目标进化算法(CMOEA-BAD)。该算法设计了主种群和辅助种群,它们分别独立进化,以求解原始问题和辅助问题。对于主种群,CMOEA-BAD将理想点和最低点的角度信息结合构成平均矢量角,并将该角度融入约束支配原则进行个体选择,以平衡种群的多样性和收敛性。对于辅助种群,本文设计了一种种群规模动态缩减机制,通过动态地调整辅助种群的规模,降低其在进化过程中所占用的计算资源,以加快算法的收敛速度。为验证算法性能,将所提出算法在MW和DTLZ测试问题上与PPS、BiCo、NSBiDiCo、MFOSPEA2、和CMOES算法进行比较分析,并应用于实际工程问题中。实验结果表明,本文提出的算法不仅能够有效平衡种群的收敛性和多样性,还显著提高了算法的收敛速度。算法整体运行时间缩短了28%,综合性能更优。
优先出版时间:2025-02-23 DOI: 10.13195/j.kzyjc.2024.0942
摘要:基于卷积神经网络(CNN)进行运动想象(MI)解码是智能康复的一个研究热点,而目前的解码方法难以针对脑电信号的个体差异性动态深度挖掘其蕴含的时-频-空特征,影响解码效果.为此,本文提出一种基于动态卷积和注意力机制的CNN模型(DCAMNet).首先,使用滤波器组对每导原始脑电信号进行多频带划分,并同时输入特征提取模块;然后,由动态卷积块动态计算注意力权重,获得有价值的时频信息,再依次经空间卷积块和时间注意力块学习和挖掘空间信息和时间相关性,实现个性化时-频-空特征提取与融合;最后,由分类模块完成MI解码.基于公开的BCI Competition IV dataset 2a数据集对9名受试者进行四分类十折交叉验证实验,取得了79.17%的平均准确率和0.788的F1值.结果表明,DCAMNet能够自适应地关注和增强受试者个性化的特征,实现多域特征提取与融合,相对于现有的流行方法在解码精度和泛化性能上具有一定优势.
优先出版时间:2025-02-17 DOI: 10.13195/j.kzyjc.2024.1232
摘要:密度峰值聚类算法简单、高效,可识别任意维度和形状类簇,已在各领域得到广泛应用。然而,密度峰值聚类算法也存在一些问题,如:对截断距离参数敏感、难以发现低密度区域的类簇中心以及容易产生“多米诺效应”。为此,本文提出混合近邻和多簇合并的密度峰值聚类算法。首先,综合考虑样本的全局分布与局部结构,引入自然近邻与k近邻重新定义局部密度,消除对截断距离参数的敏感,并提高低密度区域样本的局部密度以增加类簇中心的识别度;其次,将样本划分为多个微簇,并利用簇间关联度进行合并,减少距离类簇中心较远的样本的分配错误,从而有效缓解分配错误连带效应。使用人工数据和真实数据进行测试,结果表明,本文所提算法的综合性能优于对比算法。
优先出版时间:2025-02-17 DOI: 10.13195/j.kzyjc.2024.0839
摘要:为了研究骑行者异质性影响下进站公交与自行车通行概率的演化机制,本文将自行车骑行者分为冒险型和保守型,以公交车驾驶员和自行车骑行者各自通过冲突区域的损失最小为目标,构建进站公交与自行车的冲突演化博弈模型,引入前景理论和从众效应对模型进行优化,求解并分析系统的演化结果,最后利用数值仿真对模型的关键参数进行灵敏度分析。研究结果表明,交通管理部门应该制定优先规则引导系统收敛于不对称整数解;基于前景理论考虑骑行者异质性和从众效应的演化博弈模型更加符合实际的交通场景;从众效应和冒险型骑行者占比对自行车骑行者通过概率的影响是显著的,公交优先通行权的设置能有效规避其对公交车驾驶员决策的影响;各类型骑行者对自行车骑行者通过概率的主导地位并非体现在人数占比上。此研究成果可以为制定公交站冲突区域的交通礼让规则提供理论基础与实践支持。
优先出版时间:2025-02-11 DOI: 10.13195/j.kzyjc.2024.1102
摘要:本文针对一类具有复杂非线性和输出约束的输出反馈非线性系统提出了一个自适应事件触发跟踪控制方法,其中系统的复杂非线性由与输出相关的非线性函数和不可测状态耦合构成.为了估计不可测的状态变量并补偿复杂的系统非线性,首先利用增益调节技术设计一个动态高增益,并基于此设计一个修改的高增益K-滤波器.然后,对跟踪误差引入性能约束函数并设计自适应动态面输出反馈控制器.基于此控制器设计一个触发条件来确定事件触发控制信号,使得系统的通信资源得到有效的节约.结果表明,利用所提的方案,系统的复杂非线性和触发误差均能被有效处理,输出约束能被保证,并且跟踪误差能够收敛到一个任意小的紧集.最终,控制方案的有效性通过高超声速飞机得到验证.
优先出版时间:2025-02-07 DOI: 10.13195/j.kzyjc.2024.1300
摘要:弯道车道线因其复杂的几何与视觉特征,检测难度较直线车道线高。针对现有弯道车道线检测算法普遍存在的识别精度不足问题,本研究提出了一种基于多尺度特征融合和组合结构损失优化的深度学习弯道车道线检测方法,旨在高效且准确地提取及识别弯道车道线。在图像预处理中,本文采用区域特定的裁剪策略,根据车道线在图像中的相对位置,通过选定的裁剪比例保留图像关键区域。这种方法有效减少环境干扰,并提升模型预测速度。基于优化的图像输入,构建了一个深度学习模型,该模型整合了ResNet34主干网络、特征金字塔网络(FPN)及动态卷积模块,利用多尺度特征融合技术显著提升车道线检测的准确性。为了进一步优化检测效果,文章还引入了一种新型组合结构损失函数,该函数融合了位置损失与形状损失,不仅优化了车道线位置估计,还增强了在弯道中的形状连续性。在CULane数据集的弯道场景测试中,本方法达到了85.54的F1评分,证明了其高准确性和鲁棒性。
优先出版时间:2025-02-07 DOI: 10.13195/j.kzyjc.2024.1245
摘要:针对公交客流检测因忽略边缘计算而导致的数据处理延迟和准确性问题,基于“云-边-端协同架构”提出一种实时且轻量级的公交客流检测算法BPF-DETR。首先,采用RT-DETR-r18作为基线算法以提高实时处理能力;其次,引入轻量级iRMB模块更新ResNet-18作为特征提取主干,通过倒置残差结构充分学习乘客目标的长距离特征交互以及小目标的局部特征交互,在提高轻量性和精度的同时增强算法的边缘适用性;再次,引入ASF架构中的SSFF模块和TFE模块构建多尺度特征融合模块MSFM,进一步提升算法在多尺度和复杂环境下的检测精度;最后,为了验证算法有效性,采用基于ROI的图像拼接方法,提高数据集的代表性与多样性,构建公交客流监控数据集进行训练验证。实验结果表明,BPF-DETR的mAP@0.5为96.4%,模型大小为32.6MB,均优于目前主流的YOLO系列模型,相较于基线算法,mAP@0.5提升了1.1%,模型大小下降16%,满足公交客流检测准确率及边缘部署轻量化要求。
优先出版时间:2025-02-07 DOI: 10.13195/j.kzyjc.2024.1019
摘要:对于部分可观马尔科夫决策过程下的多智能体路径规划任务,现有研究大多在栅格或者质点环境下研究,和真实物理环境有较大差距。本文研究如何在更加接近实际物理约束环境下提升多智能体协同路径规划的效果。一方面,在考虑真实物理约束的情况下,根据执行器饱和和欠驱动等构建多约束动作空间,根据距离与位置等搭建多源输入状态空间,设计抗冗余奖励函数以减小无人车行驶过程中动作冗余。另一方面,针对在Gazebo环境下训练难度高、效率低、难收敛等问题,提出基于预训练-微调方法的多智能体双延迟深度确定性策略梯度算法,利用预训练使模型获得一个更优的初始值,提升训练效率,同时利用微调对预训练先验模型针对性优化,增强了模型训练过程抵抗环境不平稳性能力。在Gazebo仿真环境中,通过与PMATD3、MATD3、MADDPG等算法对比,验证了本文所提算法的有效性。
优先出版时间:2025-02-06 DOI: 10.13195/j.kzyjc.2024.0959
摘要:密度峰值聚类算法(DensityPeakClustering,DPC)自从在2014年被学者Rodriguez提出以后,其简洁的聚类原理受到了诸多青睐,并被广泛应用于各个研究领域.尽管DPC能够识别任意形状的类簇,但存在两大明显不足:一是在密度分布不均的数据集中不能正确发现稀疏集群的聚类中心;二是剩余点分配策略容易引起连锁反应导致数据点归类错误.为了弥补DPC的不足,本文提出了一种基于双向代表点(BidirectionalRepresentativePoint,BRP)和相互K近邻(Mutual K-Nearest Neighbors,MKNN)的密度峰值聚类算法,称为BRPMK-DPC.首先,该算法设计了一种基于正向K近邻代表点和逆向逆K近邻代表点的局部密度计算方法,好处是可以在密度分布不均的数据集中高效识别正确的聚类中心.其次,本文提出了一种相互K近邻的剩余点分配方法,在分配过程中具有自适应性,避免衍生类DPC算法采用固定K值带来的劣势,该方法主要包括两个算法:算法1利用相互K近邻与广度优先搜索进行初次分配;算法2通过计算剩余点的隶属度概率进行再次分配.最后,BRPMK-DPC算法在人工合成数据集、真实数据集和人脸数据集上进行了测试,实验结果表明提出的算法不仅能够高效识别密度不均集群的聚类中心,而且在大部分数据集上的聚类性能优于其它七种对比算法.
优先出版时间:2025-02-06 DOI: 10.13195/j.kzyjc.2024.1268
摘要:本文针对布尔控制网络在非周期性拒绝服务 (Denial of Service, DoS) 攻击下的镇定控制问题展开研究. DoS 攻击是一类通过阻断网络节点间信息传输而削弱系统性能的常见网络攻击. 本文研究服从独立同分布过程的非周期性 DoS 攻击. 首先将遭受攻击的布尔控制网络转化为概率布尔网络, 进而得到系统能够全局随机稳定的充分必要条件. 其次, 基于可达集构造方法, 设计了能够保证系统稳定的状态反馈控制器. 最后, 通过仿真实验验证了所提出理论与控制方法的有效性.
优先出版时间:2025-02-05 DOI: 10.13195/j.kzyjc.2024.1131
摘要:本文研究状态不可知且存在外部干扰和执行器故障情形下的线性多无人机系统预设时间编队容错跟踪控制问题.首先,为编队中的每个跟随无人机的线性增广系统设计了一类新型观测器,利用周期时滞输出信息,该观测器能够在预先设定的时间内同时实现状态观测、扰动观测以及故障估计;基于观测器信息获得分布式任意预设时间编队容错跟踪控制协议,无人机系统能够在物理允许范围的时间内迅速实现编队跟踪一致,且用户预设时间的选取理论上与系统初值和参数都无关.无人机系统编队的数值仿真验证了理论结果的有效性.该策略在工程应用中显示一定的潜力价值,试图为复杂环境下的多无人机编队快速控制提供解决方案.
优先出版时间:2025-01-31 DOI: 10.13195/j.kzyjc.2024.1257
摘要:实际仿真模拟辅助设计的多目标优化问题,完成一次性能评估,成本代价极其昂贵.基于历史数据训练廉价的代理模型,辅助多目标优化算法求解昂贵多目标优化问题,是目前主流方法之一.然而,当优化目标数量增多时,将面临模型管理中如何选取新样本改善模型质量的困难.为此,本文将从多个目标估值与其可靠性平衡、解的收敛性和多样性自适应平衡、当前样本分布三方面考虑,分别提出了基于线性组合置信下界函数、自适应性能平衡函数、标量偏差矩阵的三个采样准则,并行选取若干个体进行真实函数评价后填充样本集,提高模型引导多目标优化算法寻优效率.同时,引入非支配样本引导当前种群搜索,加快定位最优区域.最后应用两个经典多目标问题集和两个优化实例,与五个先进算法比较,验证了所提算法的有效性.
优先出版时间:2025-01-18 DOI: 10.13195/j.kzyjc.2024.0977
摘要:针对存在执行器故障、外部干扰、输入输出量化误差和网络诱导时延的不确定性航空发动机分布式控制系统,提出了自适应事件触发H∞ 控制方法. 首先,对执行器故障、外部扰动、量化误差和系统不确定性进行数学描述,给出了自适应事件触发机制来提高网络资源的利用率,并建立了考虑以上因素的闭环系统数学模型. 然后,利用Lyapunov-Krasovskii泛函方法建立了保证系统渐近稳定的充分条件,并给出了以线性矩阵不等式形式的自适应事件触发器和H∞ 控制器的协同设计方法. 在给定的仿真条件下,自适应事件触发机制节省的网络资源达到94%,相较于普通的事件触发器提升了46.4%. 仿真结果表明,所提出的事件触发器和控制器能够保证系统在以上考虑的不良因素下仍然渐近稳定.
优先出版时间:2025-01-17 DOI: 10.13195/j.kzyjc.2024.1161
摘要:在无人机目标跟踪任务中, 实时规划一条安全、有效且具有高度目标可见性的轨迹, 是实现目标稳定跟踪的关键. 为保证无人机在复杂未知环境下实现目标稳定跟踪, 提出了一种无人机主动观测轨迹规划方法. 首先,使用预测模型获得一系列离散的未来目标轨迹点; 其次, 根据当前环境地图信息, 在每个目标轨迹点周围生成可视区域和初始视点, 并设计一系列代价函数对视点进行优化; 最后, 结合每个目标轨迹点的最优视点位置约束对无人机跟踪轨迹进行优化. 仿真结果表明, 所提出方法能够在各种复杂环境中完成目标实时稳定跟踪任务, 较好地解决了现有方法存在的目标被遮挡问题.
优先出版时间:2025-01-14 DOI: 10.13195/j.kzyjc.2024.0852
摘要:为推动低空经济发展,提高企业经济效益和“最后一公里”配送效率,提出考虑客户收益和时间窗的多行程卡车-无人机协同配送问题。首先,以最大化利润为目标建立基础的混合整数规划模型(MIP),并融入有效不等式以减少基础模型的松弛度。然后,提出一种高效的混合启发式算法求解该问题,同时考虑到具有时间窗特征的卡车-无人机路径较为复杂,可行性判断耗时高,因此设计了一种基于Segment的有效评估方法加速路径的可行性检查,以提高算法的求解效率。实验结果表明,有效不等式可以将精确求解器——Gurobi求解模型的速度提高44%;其次,在不同规模的算例中,所提出的混合启发式算法在求解效率和质量方面均优于Gurobi和两类启发式对比算法,并表现出良好的稳定性;此外,通过嵌入Segment有效评估方法可以减少算法95%的求解时间。
优先出版时间:2025-01-14 DOI: 10.13195/j.kzyjc.2024.1067
摘要:随着在线零售业快速发展,线上订单数量日益庞大,分仓选品对于高效服务线上订单愈发重要.现有研究多从降低拆单率的角度优化选品方案,忽略了拆单造成的额外运输距离差异.本文首先构建以最小化拆单率和运输距离为目标的分仓选品问题模型,提出综合衡量订单商品分布和客户地理分布的商品间适应度指标,并结合谱聚类方法设计了基于固定-优化框架的两阶段分仓选品算法.数值实验表明,与直接求解分仓选品模型相比,算法的固定阶段能够有效缩小搜索空间,在保证求解质量的前提下提升求解效率;与现有文献算法相比,本文算法能够显著降低运输距离和拆单率,为企业优化分仓选品方案提供决策支持.
优先出版时间:2025-01-11 DOI: 10.13195/j.kzyjc.2024.1273
摘要:无人机航拍图像具有尺度差异大、背景干扰和目标模糊等特点,给小目标检测带来了诸多挑战.针对这些问题,提出了一种高效的无人机航拍小目标检测算法.首先利用空洞卷积增大感受野、保持细节分辨率的特点,设计了并行空洞卷积模块.其次设计了注意力上下采样分支模块,利用闸门机制对提取到的特征进行选择,强化特征表达.最后结合小目标检测头,设计了并行空洞卷积注意力金字塔网络,对多尺度特征进行特征融合.在VisDrone2023数据集和DOTA数据集上,所提算法在小目标检测的平均准确率均值均优于其他主流算法,相较于基线方法在平均准确率均值上提升了7.3%,参数量减少了0.58M,FPS提升了11.2达到43.5,验证了本文所提算法的高效性.在复杂场景ExDark数据集上,所提算法在平均准确率均值上优于其他低光增强模型和暗检测器,相较于PE-YOLO在平均准确率均值上提升了2.4%,验证了本文所提算法的鲁棒性和实用性.
优先出版时间:2025-01-11 DOI: 10.13195/j.kzyjc.2024.1107
摘要:针对规划多机协调悬吊系统轨迹时忽略吊机末端轨迹和系统运动稳定性的问题,提出了一种考虑悬吊系统动态稳定性的多策略改进悬吊系统轨迹规划算法。首先,通过悬吊系统的运动学和动力学的分析得到动态轨迹稳定性评价标准。然后,定义了轨迹动态稳定性、长度等多种悬吊性能参数。随后,针对传统冠豪猪算法与悬吊系统的适配性不足等问题,通过加入Sine-Tent-Cosine混沌映射初始化种群,提高算法初始解的多样性;引入膺惩因子平衡勘探开发阶段;在勘探阶段加入了由等效偏差指数控制的柯西高斯扰动、池化机制增强算法全局搜索能力,在开发阶段加入了均衡全局和局部寻优的莱维巡回飞行策略、非线性增长的收敛因子来提高算法的收敛能力。接着,将多策略改进冠豪猪优化算法与碰撞检测算法结合,在分布有威胁区域的悬吊环境中得到了被悬吊物和吊机末端的基尼不纯度最高的轨迹。最后,通过仿真验证了所提考虑悬吊系统动态稳定性轨迹规划方案能够更好地适配多机协调悬吊系统,得到了符合悬吊性能要求的动态重构轨迹,为后续悬吊系统的控制提供了理论参考。
优先出版时间:2025-01-11 DOI: 10.13195/j.kzyjc.2024.1094
摘要:双电机驱动电动汽车能够实现前后独立转矩分配,进而可以获得更高的能量回收效率。本文针对双电机驱动电动汽车,提出一种基于双延迟深度确定性策略梯度算法(Twin Delayed Deep Deterministic policy gradient algorithm,TD3)进行改进优化的制动能量回收策略。该策略能在保障制动安全性和舒适性的同时,实现制动能量回收的最大化。首先,构建了基于深度强化学习(Deep Reinforcement Learning,DRL)的能量回收决策框架,并设计了一个综合考虑能量回收效果、安全性和舒适性的奖励函数。然后,采用TD3算法求解该决策过程,并提出了改进的优先经验回放机制,以加速策略的收敛速度。最后,本文引入了平衡探索的噪声策略,增强算法探索与利用的能力。通过Matlab/Simulink平台验证,所提出的算法在满足制动安全性和舒适性的前提下,能够更高效地分配制动力,有效地提高了制动能量回收效率。
优先出版时间:2025-01-11 DOI: 10.13195/j.kzyjc.2024.1039
摘要:针对三维空间中智能体追逃博弈策略制定与鲁棒控制问题, 本文提出了一种基于模糊强化学习与模型预测控制(model predictive control, MPC)的分层追逃博弈框架. 所提框架结合三维空间的阿氏圆和模糊行动者-评论家学习(fuzzy actor-critic learning, FACL)算法获得智能体的运动信息,然后将其用作MPC算法的参考输入来设计四旋翼无人机的控制器. 通过对四旋翼欠驱动系统模型进行解耦, 设计了考虑误差系统积分项的高度、平移和姿态控制器. 通过FACL算法提供的参考信息, 有效提高了MPC算法的控制效率. 仿真和实验结果表明, 所设计的分层框架可以很好地解决三维空间追逃博弈问题.
王国岩, 黄炎焱, 孙宇祥, 王利锋, 赵旭华, 解雨轩, 孙佳琪
优先出版时间:2025-01-11 DOI: 10.13195/j.kzyjc.2024.0984
摘要:本文针对智能空中博弈中无人机协同决策的问题展开研究。鉴于空中博弈复杂性,包括不确定性、信息不完备性和动态性等特点,提出了一种强鲁棒性的无人机协同决策技术,旨在提升无人机在复杂对抗环境中的作战效能。研究基于某高仿真度的模拟平台,利用态势感知和信息融合技术,通过构造威胁指数和综合优势指数建立了空战态势分析模型,并改进C4.5规则树算法设计、建立了上层决定决策、中层决定任务、下层决定行为的三个决策模型,优化了无人机的战术行为和响应速度。通过的实验验证发现,该技术显著提高了无人机决策的准确性和执行效率,从而提升了其在复杂空战环境中的作战效能。本文的研究成果可为未来多无人机协同作战系统的设计和实现提供理论基础和技术支持。
优先出版时间:2025-01-09 DOI: 10.13195/j.kzyjc.2024.1152
摘要:密度峰值聚类 (density peaks clustering, DPC) 算法简单高效, 能够识别任意形状簇, 但在处理簇间密度差 异大的数据集时, 不能准确识别出簇中心. 同时, 其分配策略可能会导致连续的分配错误. 为解决上述问题, 提出 一种基于 k 近邻图的密度峰值聚类 (kNNG-DPC) 算法. 首先, 算法利用 k 近邻思想构造 k 近邻全局图和局部图, 并在此基础上提出了新的局部密度和相对路径距离, 从而保证簇中心选取的正确性; 然后, 制定一种两级分配策 略, 对不同密度大小的数据点采用不同的分配策略, 以避免出现连续的分配错误. 在 10 个合成数据集和 8 个真实 数据集上, 将 kNNG-DPC 算法与 6 种优秀的聚类算法进行对比. 实验结果表明, kNNG-DPC 算法的聚类表现优于 对比算法, 能获得更好的聚类结果.
优先出版时间:2025-01-03 DOI: 10.13195/j.kzyjc.2024.1074
摘要:本文研究了一种环境搜索问题,利用地面多机器人系统查找细小物品。具体而言,地面多机器人系统将接收到的SLAM地图切割(subdivide)成房间,再将这些房间分配给各个地面机器人,以使随后的全覆盖搜索过程完成时间最快、地面机器人间无互相干扰。本文的主要创新点在于提出了一种基于双向连通边链表(DCEL)数据结构的(房间)区域处理算法,并提出了一种基于混合整数线性规划(MILP)的房间分配算法,两个算法构成了处理与分配方法。数值实验结果证明了处理算法的有效性、任务分配的均衡性安全性最优性以及其对异速地面多机器人系统的适用性,同时也在物理实验上验证了处理与分配算法的有效性。
摘要:随着四足机器人控制技术的逐渐发展,四足机器人已经广泛被应用于救援、军事、探险等领域.在四足机器人的应用中,如何在不牺牲控制性能的前提下有效降低能耗是一个重要的瓶颈问题.为此,本文提出了一种基于脉冲强化学习算法(SpikingReinforcementlearning,SRL)和中枢模式发生器(CentralPatternGenerator,CPG)的分层控制算法(SRL-CPG)用于四足机器人的运动控制.首先,考虑到脉冲神经元相比传统的人工神经元具有更低的能耗,本文基于脉冲神经网络(SpikingNeuralNetwork,SNN)构建脉冲强化学习算法,将其作为控制中枢.其次,在控制任务动作空间过大的情况下,SRL难以取得良好的控制效果,因此本文将CPG作为低级控制器,利用SRL接受状态信息并对CPG参数进行调整进而控制四足机器人运动.最后,SRL-CPG控制算法在本文于Webots环境中搭建的四足机器人模型Gbot上进行了实验验证,结果表明SRL-CPG控制算法能够有效应用于四足机器人的运动控制,并大大降低了能耗.
优先出版时间:2024-12-31 DOI: 10.13195/j.kzyjc.2024.0795
摘要:多无人机应急电力巡检的时间十分有限,在选择关键巡检目标时需要考虑各目标的故障概率差异,同时为提升巡检效率,可以引进换电站来降低无人机续航能力不足的影响.针对上述特点,将考虑多换电站的多无人机应急电力巡检路径规划问题建模为多站点多航次团队定向问题,并设计了一种融合软演员-评论家模型的遗传算法SAC-GA.首先,在遗传算法中加入两类局部搜索算子,以优化多无人机访问目标的选择和缩短无人机飞行路径距离.其次,提出了一种基于SAC模型的参数调优机制,利用SAC模型基于最大熵学习策略的优势,在遗传算法迭代过程中,根据历史学习经验和种群的状态动态生成合适的交叉、变异概率以及染色体再插入中的权距比.实验结果表明,算法在小规模实验和大规模实验上均具有明显优势,并通过消融实验验证了SAC-GA中局部搜索算子的有效性和本文参数调整方法的优越性.最后,通过案例分析验证了算法在不同应急场景下的有效性.
优先出版时间:2024-12-31 DOI: 10.13195/j.kzyjc.2024.0904
摘要:柔性作业车间调度是经典且复杂的组合优化问题,对于离散制造系统的生产优化具有重要的理论和实际意义.基于多指针图网络框架和近端策略优化算法设计了一种求解柔性作业车间调度问题的深度强化学习算法.首先,将“工序-机器”分配调度过程表征成由选择工序和分配机器两类动作构成的马尔可夫决策过程.其次,通过解耦策略解除动作之间的耦合关系,并设计了新的损失函数和贪婪采样策略以提高算法的验证推理能力.在此基础上,扩充了状态空间,使评估网络能够更全面地感知与评估,从而进一步提升算法的学习和决策能力.在随机生成算例及基准算例上进行仿真和对比分析,验证了算法的良好性能及泛化能力.
优先出版时间:2024-12-31 DOI: 10.13195/j.kzyjc.2024.1139
摘要:本文提出了一种具有自适应能力的非奇异快速终端滑模控制(non-singular fast terminal sliding mode control,NFTSMC)方法,可以有效提高受外部扰动和参数变化下的异步电动机速度控制性能。文中首先设计了一种具有自适应能力的非线性控制方法,可以在有效提高系统抗干扰能力和动态响应性能的基础上,抑制滑模抖振现象,且可以规划滑模收敛率。其次,本文提出的滑模负载转矩观测器(sliding mode load torque observer, SMLTO)可以保证在负载转矩发生波动时,快速准确地跟踪到实际转矩,从而减小了由负载转矩突变导致的速度波动,提高了控制精度和鲁棒性能。此外,文中所提方法采用了非奇异终端滑模控制方法,可以加快系统状态收敛速率,同时避免了传统滑模控制中的奇异性问题。实验结果表明,该方法显著提升了异步电机速度控制系统的鲁棒性和响应速度,具有良好的负载转矩观测性能。
优先出版时间:2024-12-31 DOI: 10.13195/j.kzyjc.2024.1178
摘要:为保障下肢失能患者主动康复训练的效果和安全性, 针对下肢康复外骨骼机器人设计一种基于非对称积分障碍李雅普诺夫函数的无力矩传感器导纳控制方法. 首先, 基于广义动量法设计一种滑模观测器, 用以实时估计人机交互力矩, 从而降低下肢外骨骼对力矩传感器的依赖. 其次, 面向下肢外骨骼构建一种导纳控制框架, 利用饱和函数将外环导纳模型生成的参考轨迹约束在预定的安全区间内, 以保证外骨骼的柔顺性与安全性. 此外, 针对内环步态轨迹跟踪设计一种基于非对称积分李雅普诺夫函数的反演滑模控制算法, 保障系统的输出约束性能与步态轨迹跟踪精度. 最后, 基于李雅普诺夫稳定性判据证明控制系统的稳定性, 并在下肢康复机器人实验平台上验证所提出控制算法的有效性和优越性.
徐森, 刘轩绮, 陈朝峰, 郭乃瑄, 卞学胜, 马芙蓉, 花小朋, 周天
优先出版时间:2024-12-28 DOI: 10.13195/j.kzyjc.2024.0874
摘要:为了捕捉网络的隐藏结构,减少社区检测模型对初始参数选择的依赖性,本文提出一种基于概率分布分层图聚类网络(Hierarchical Graph Clustering Network with Probability Distribution,HGCPD)的社区检测模型。首先,利用图卷积网络学习和缓存图中节点的特征表示;其次,引入一种基于节点对相似度概率的分层聚类方法,在不同层次上递归地构建社区结构;最后,探究模型超参数优化问题,设计贝叶斯优化方法自动调整参数,从而提升模型效率。在多个不同规模的网络数据集上的实验表明,HGCPD模型在社区检测的准确性、有效性均优于主流方法,并通过可视化验证了模型的可解释性。
优先出版时间:2024-12-23 DOI: 10.13195/j.kzyjc.2024.0973
摘要:针对一类多智能体系统的非光滑约束优化问题,通过构造合适的时变增益函数和动态事件触发通信机制,提出了一种结构简单的基于动态事件触发的分布式预定时间优化算法. 与现有分布式非光滑约束优化研究工作相比,本文提出的算法主要有以下三点特征: 1) 收敛性能更优: 收敛时间可由设计者提前给定且收敛时间上界与系统初始状态及控制参数无关;2) 通信效率更高: 避免了传统连续时间/周期通信带来的通信资源浪费问题;3) 算法结构更简单: 无需传统的分数幂反馈及额外的辅助变量. 综合运用预定时间收敛理论、惩罚函数法、代数图论及凸优化理论,证明了系统决策变量在预定时间内收敛于最优解的可调邻域内,且不存在Zeno 现象. 仿真验证了我们所提算法的优势及有效性.
优先出版时间:2024-12-16 DOI: 10.13195/j.kzyjc.2024.0603
摘要:随着装备产品精密化和商业环境复杂化,数量柔性化正在成为装备制造企业应对内外部制造环境干扰、实现最优制造总利润的重要途径。针对被忽略的制造结构、制造合格率、市场需求与数量柔性之间的内在逻辑关系,本文结合装备制造企业制造系统的串联结构特征进行理论建模与分析,以期回答“串联制造结构下装备制造企业如何选择最优匹配的柔性数量策略”这一问题。研究结果表明:与单环节制造结构相比,串联制造结构的最优数量柔性更大但制造总利润更低;串联制造结构的装备制造企业总有动机采用柔性数量策略;串联制造结构下,随着前序制造环节1的制造合格率提高,装备制造企业的最优数量柔性呈倒U型变化;随着数量柔性边际成本增加,装备制造企业的最优数量柔性与制造总利润降低。以上结论可为串联制造结构下装备制造企业柔性数量策略的制定与实施提供有益的参考。
优先出版时间:2024-12-14 DOI: 10.13195/j.kzyjc.2024.0897
摘要:面对日益增长的卫星数量和多样化的任务需求, 在轨成像卫星群任务调度的难度不断提升. 现有方法大多针对小规模或单一类型的卫星和任务, 难以适应大规模卫星资源下多类型任务的协同调度需求. 针对上述问题, 本文提出了一种综合考虑多类型任务的成像卫星群调度模型与算法. 在模型构建方面, 本文设计了广义观测收益函数, 该函数能够统一评估包括普通点目标、周期性点目标和区域目标在内的不同任务类型的收益. 同时,模型还考虑了卫星资源的限制和任务的特定要求, 以确保生成的调度方案合理高效. 在算法设计方面, 提出一种深度强化自适应大邻域搜索算法 (An Adaptive Large Neighborhood Search Algorithm based Deep ReinforcementLearning,DRL-ALNS). 该算法利用深度强化学习的自主学习能力, 在自适应大邻域搜索框架中智能地进行算子选择和参数配置, 从而有效应对大规模搜索空间的挑战. 为了验证本文提出的方法的有效性, 将其与多种对比算法进行了实验. 结果表明,DRL-ALNS 在任务收益值上平均提升了 7.6%, 证明了其在解决多类型任务成像卫星群调度问题中的有效性和优越性.
Junbao, 张建强, 董海迪, 随博文, 刘忠, 张媛媛
优先出版时间:2024-12-05 DOI: 10.13195/j.kzyjc.2024.0857
摘要:针对自主水面船轨迹跟踪的导引问题,提出一种基于新型导引向量场的轨迹跟踪导引方法。首先,为了简化导引律的设计,以轨迹点为原点构建Serret-Frenet坐标系,并在该坐标系下基于自主水面船运动模型构建轨迹误差模型。然后,考虑到相对位置对于自主水面船轨迹跟踪性能具有较大影响,设计了一种新型的导引向量场。该向量场利用分段函数为自主水面船在与轨迹点不同相对位置情况下提供相应的导引律,在保证相对稳定的艏向和速度的基础上实现高效精确的轨迹跟踪。此外,所提供的艏向角指令函数为光滑曲线,提高实际中指令的可执行性。其次,依据该向量场设计艏向和速度的导引律,基于Lyapunov稳定性理论证明系统的跟踪误差最终一致有界。最后,通过仿真验证该方法的有效性。
优先出版时间:2024-12-05 DOI: 10.13195/j.kzyjc.2024.0808
摘要:针对柔性关节机械臂控制精度低和轨迹跟踪控制动态性能差等问题,提出一种笛卡尔空间力补偿的轨迹跟踪控制算法,旨在提高笛卡尔空间轨迹跟踪精度. 首先,介绍了串联弹性执行器(SEA)和六自由度(6-DoF)机械臂系统模型,并设计了基于神经网络模型预测控制(NNMPC)的关节空间位置-速度-力矩混合控制算法. 随后,基于该关节控制器,设计了基于柔性关节机械臂的笛卡尔空间力补偿控制算法,该算法根据笛卡尔空间的跟踪误差,结合PID控制器计算出笛卡尔空间中的力补偿值,然后将其转换为关节力矩补偿值并补偿到关节控制器,以实现高精度的笛卡尔空间轨迹跟踪. 最后,通过仿真和实验验证了该控制器的有效性和优越性. 实验结果表明,设计的轨迹跟踪控制器整体精度为1.86mm,相较于无补偿的轨迹跟踪和基于位置补偿的轨迹跟踪控制算法,精度分别提升了2.91mm和1.77mm.
优先出版时间:2024-12-03 DOI: 10.13195/j.kzyjc.2024.0743
摘要:赤铁矿再磨过程是针对低品位赤铁矿的特有选矿过程,给矿压力控制是再磨过程的关键工艺过程。为了保证给矿压力的精确控制,本文将常规PI控制与信号补偿技术和强化学习相结合,提出一种智能PI控制方法。首先,将被控对象描述为低阶线性模型加频繁变化的未知非线性动态系统的形式,采用精确计算的前一时刻未知非线性项和闭环运行数据,设计补偿信号,叠加到PI控制器的输出,从而改善控制系统的动态性能。其次,利用闭环系统的实时运行数据,采用强化学习迭代求取最优的PI控制器和补偿器参数,保证闭环系统的稳定运行。最后,通过与已有方法的对比实验和工业过程真实数据的物理实验,实验结果表明了所提方法的优越性。
摘要:针对机坪环境下,多种类地面服务车辆的协同调度这一复杂的优化任务,本文提出了一种结合Transformer架构的深度强化学习算法。首先,依据航班地面服务流程的不同优先级,将整个地面服务任务进行分解,进而将原本复杂的多类型车辆调度问题转化为有先后顺序的单类型车辆调度问题。接着,利用Transformer架构对航班和车辆的特征进行自动提取,通过解码器按序列逐步求解任务调度,结合贪婪算法和蒙特卡洛模拟算法分别生成初步调度策略,并将这些策略应用于每个子问题的求解过程中。在此基础上,利用深度强化学习算法对整个模型进行训练,通过智能体与环境的交互来不断优化调度策略。此外,为了提升模型的鲁棒性和应对复杂情况的能力,本文还通过扩充真实数据集进行模型训练。最后,大量的实验证明,基于Transformer架构的深度强化学习方法能够有效避免不同种类车辆之间的相互干扰,并很好地应对真实环境下的航班调度需求。
优先出版时间:2024-11-25 DOI: 10.13195/j.kzyjc.2024.0949
摘要:针对直流微电网储能系统中存在的荷电状态(state of charge, SOC)不均衡、电流分配精度差以及直流母线电压偏差等问题,本文提出了一种提高均流精度的直流微电网分布式储能SOC加速均衡控制策略。首先,在基于双曲正切函数的自适应下垂控制中引入基于指数函数的变加速收敛因子,能够在限制下垂系数范围的基础上加快实现储能间的SOC均衡。为减小线路阻抗对电流分配的影响,对各个变换器进行虚拟压降均衡控制,同时对补偿量实施自适应调节,以达到减小线路阻抗对SOC均衡效果影响的目的。最后对母线电压进行二次电压补偿,解决下垂惯性导致的母线电压偏差问题。此外,提供了基于系统特征方程的稳定性分析,在理论上保证了直流微电网的稳定运行。最后,通过MATLAB/Simulink对所提控制策略的有效性进行了验证。结果表明,本文所提控制策略可有效提升SOC均衡速度和均流精度,使母线电压稳定维持在额定值。
优先出版时间:2024-11-25 DOI: 10.13195/j.kzyjc.2024.0666
摘要:面对重大突发公共卫生事件,单体城市的防疫资源总是有限的,而利用好不同城市感染错峰,协同调度好城市群内部的不同防疫人员及物资,可以有效提高应急救援效率。基于此,本文从感染错峰的视角,构建了一类涵盖应急医院选址、应急物资跨区域转运、医护人员跨区域支援的疫情应急资源跨区域协同调度优化模型。在该混合整数规划模型中,充分考虑了资源调度过程中的多重异质性、多周期下多决策耦合效应等。为便于模型求解,本文根据错峰协同调度问题特性,提出了两个新的逻辑不等式来添加切割。研究结果表明,面对重大突发公共卫生事件,患者的需求满足率才是决策者首要的考虑因素;在实施分级诊疗的过程中,应选择轻症宽松匹配策略而非最优的完全匹配策略;同时决策者也需要注意,应急救援物资量、医护人员数以及应急医院容量等重要参数均存在较为明显的阈值效应,这些研究结论可为重大突发公共卫生事件应急资源跨区域协同调度提供具体决策支撑。
优先出版时间:2024-11-22 DOI: 10.13195/j.kzyjc.2024.0195
摘要:为实现在轨任务所需的快速高精度的力/位控制,研究了双臂空间机器人在轨辅助对接操作的阻抗控制问题。首先,利用Lagrange方法建立了双臂空间机器人捕获操作后形成闭链混合体系统动力学方程;基于阻抗控制理论建立了二阶线性阻抗模型和二阶近似环境模型。接着,利用径向基神经网络(Radial Basis Function Neural Networks, RBFNN)对系统不确定因素进行分块逼近。然后,考虑有限时间内收敛的控制需求,引入添加了非线性项并经过分段式改良的快速非线性滑模面(Fast Nonlinear Sliding Mode Surface, FNSMS),并通过设计边界层函数来抑制所引入的滑模项带来的抖振。最后,通过Lyapunov稳定性判定验证了系统的稳定性。仿真结果表明,所提控制算法收敛速度快、稳定性好、鲁棒性强,可同时实现高精度的力/位控制,其姿态控制精度优于0.5°,位置控制精度优于0.001m,输出力的控制精度优于0.5N。满足双臂空间机器人在轨辅助对接操作的任务需求。
李阿辉, 刘锦元, 付明磊, 高魏磊, 官柏平, 应鑫森, SYCHOU Uladzislau
优先出版时间:2024-11-22 DOI: 10.13195/j.kzyjc.2024.0457
摘要:针对基于图搜索的路径规划算法难以在连续空间中找到最优路径和基于采样的路径算法路径生成效率低的问题,本文提出了一种基于凸剖分知情采样的最优路径规划算法(Informed Sampling of Convex Dissection, CDI-RRT*)。首先,该算法对静态地图进行凸剖分并建立拓扑图,在拓扑图的指引下使用A*算法生成初始路径并使用弹性带算法对其进行优化,从而获取初始局部最优路径;之后,该算法在拓扑图的指导下构建初始树,并结合剖分线约束与Informed-RRT*算法的知情集约束构建动态采样域,通过在动态采样域中随机采样来优化初始树,进而规划出最优路径。最后,本文将CDI-RRT*算法与目前先进的最优路径规划算法在仿真以及实际场景下进行实验对比。实验结果表明,CDI-RRT*算法在初始路径生成效率、最优路径的生成效率等核心指标上均优于对比算法,充分验证了该算法的可行性与有效性。
摘要:在进站安检智能化进程中,对于行人是否携带了行李物品的识别研究是必不可少的。针对在行人检测任务中,忽视了对其携带的物品一并进行检测,且在复杂场景中由于多尺度和遮挡导致误检和漏检等问题,提出了一种在安检场景的行人及携带物同步识别的方法。构造了一种易部署的轻量级深度学习网络模型PCD-MLNet检测行人及携带物目标。使用改进的HGNetV2作为模型的主干网络,提取不同尺度的输入特征。提出了一种可扩张的多分支残差模块DMRModule,结合大核卷积操作,增强行人及携带物特征提取的层次性和细节感知能力。使用EIoU作为检测网络的定位回归损失函数,提高模型对目标的定位能力。在创建的行人-携带物数据集实验中,PCD-MLNet取得了良好的性能,检测精度达到72.3%。对冗余通道剪枝之后,最终模型的参数量较基准模型下降了58.6%,视频推理速度提升35.0%。在仿真平台上的模拟安检实验也获得良好效果。
摘要:针对代理优化中样本策略贪婪特性使其后期收敛缓慢且解的精度不高问题, 提出了一种协同改进聚合策略, 并进一步拓展为面向昂贵黑箱问题的高效代理优化方法. 所提策略采用切比雪夫分解将概率改进和均值改进准则集成,通过随机权重系数实现全局探索和局部搜索能力的平衡. 此外,从候选点集视角出发, 分析了代理优化与代理辅助优化方法二者的不同, 进一步挖掘随机因素在优化设计中的作用. 试验结果表明: 该方法可有效提升昂贵黑箱问题优化解的收敛精度; 与同类方法相比, 该方法在解的精度和稳健性方面具有一定优势.
摘要:四足机器人由于其特殊的腿部结构能够适应各种复杂地形, 而现在的基于虚拟模型的 QP(二次规划)算法研究大多未考虑地形信息或考虑不够全面, 在复杂地形下稳定性和精确性受到限制. 本文提出了一种基于机器人本体感知系统估计地形复杂度的方法, 并基于此方法改进了四足机器人控制器, 提升其在非结构化地形下的稳定性. 本文首先利用了四足机器人的本体感知能力、足端运动学以及质心动量反馈设计了一种综合性的地形复杂度估计函数, 将四足机器人的地形评估与动态性能评估结合在一起评价地形复杂度. 然后在四足机器人虚拟模型控制的基础上, 在支撑相加入利用地形复杂度估计函数的外力干扰补偿与支撑力约束, 提升控制算法在支撑相的稳定性, 在摆动相则利用估计函数进行落足点规划并调整步态周期, 提升机器人的动态能力与适应性. 为了验证本文提出方法的有效性, 利用四足机器人 UnitreeA1 仿真模型与 webots 仿真软件设计了一系列实验, 实验结果证明本文提出的方法能有效提高四足机器人在非结构化地形上工作时的稳定性.
优先出版时间:2024-10-16 DOI: 10.13195/j.kzyjc.2024.0618
摘要:离线强化学习旨在从固定的静态数据集中学习策略,这种数据驱动的学习范式为强化学习从模拟环境到真实世界的转变提供了极大可能。然而,离线数据集通常是由不同水平的策略收集而来的,其动作分布呈现出一种难以表达的多峰状态。并且,离线数据集中的高回报轨迹较为稀缺,使得策略学习的效率低下。为此,本文提出一种基于优势约束扩散策略的离线强化学习方法。首先,利用扩散模型的反向扩散步骤生成策略,以更好地拟合多峰行为策略。然后,提出利用优势函数对策略提升进行克隆指导,以帮助智能体更加专注于数量稀少的高回报轨迹。最后针对连续控制任务和稀疏奖励导航任务分别构建了两种优势函数。在bandit任务和D4RL基准上的实验结果表明:所提方法有效缓解行为策略表达能力受限及高回报轨迹稀缺的问题,在大多数任务获得最高的归一化得分。
优先出版时间:2024-09-06 DOI: 10.13195/j.kzyjc.2024.0798
摘要:本文研究在(p,N)-策略控制下耐烦服务员不中断多重休假M/G/1排队系统,其中每当系统变空时,服务员就去进行一次不中断的休假,当服务员休假回来时,如果系统中等待服务的顾客数大于等于事先设置的正整数阈值N(N≥1)时,则服务员立即开始服务直到系统再次空竭,若系统中有顾客但顾客数少于N个,则服务员以概率p(0≤p≤1)开始服务,以概率(1-p)不服务处于通常的闲期直到系统中的顾客数累积到N个时才服务.通过系统稳态队长的随机分解定理得到系统稳态队长分布的概率母函数和平均队长表达式,同时应用Little公式得到任意顾客的平均等待时间表达式.最后建立系统的费用结构模型,利用更新报酬定理推得系统长期运行单位时间的期望成本费用函数.进一步,在没有平均等待时间和有平均等待时间约束下,通过数值实例分别讨论了系统的优化控制问题,并确定了使得系统费用最小的一维最优控制策略N*和当休假时间为T时的二维最优控制策略(N*,T*).
2024,39(11):3521-3546DOI: 10.13195/j.kzyjc.2024.0698
2024,39(10):3169-3180DOI: 10.13195/j.kzyjc.2023.0784
2024,39(10):3181-3189DOI: 10.13195/j.kzyjc.2023.1753
2024,39(11):3547-3556DOI: 10.13195/j.kzyjc.2023.1354
2024,39(11):3557-3566DOI: 10.13195/j.kzyjc.2023.0945
2024,39(10):3216-3224DOI: 10.13195/j.kzyjc.2023.1095
2024,39(10):3207-3215DOI: 10.13195/j.kzyjc.2023.0852
2024,39(11):3586-3596DOI: 10.13195/j.kzyjc.2023.1353
2024,39(10):3190-3198DOI: 10.13195/j.kzyjc.2023.0596
2024,39(11):3567-3576DOI: 10.13195/j.kzyjc.2023.1616
2024,39(10):3199-3206DOI: 10.13195/j.kzyjc.2023.0786
2024,39(11):3577-3585DOI: 10.13195/j.kzyjc.2023.1054
2024,39(9):2817-2832DOI: 10.13195/j.kzyjc.2023.1661
2024,39(9):2858-2866DOI: 10.13195/j.kzyjc.2023.1424
2024,39(9):2833-2857DOI: 10.13195/j.kzyjc.2023.0924
2024,39(9):2885-2893DOI: 10.13195/j.kzyjc.2023.0545
2024,39(9):2876-2884DOI: 10.13195/j.kzyjc.2023.0444
2024,39(9):2867-2875DOI: 10.13195/j.kzyjc.2023.0414
2024,39(8):2484-2501DOI: 10.13195/j.kzyjc.2023.0451
2024,39(8):2465-2483DOI: 10.13195/j.kzyjc.2024.0153
展开全部目录
办公地点:东北大学 综合楼313室
通讯地址:沈阳市和平区文化路3巷11号 东北大学125信箱 《控制与决策》编辑部(110819)
收件人:《控制与决策》编辑部 (如果快递,请选择EMS或顺丰快递,其他快递无法送达。)
电话: 024-83687766,23906437
版权所有 :控制与决策
技术支持:北京勤云科技发展有限公司
E-mail: kzyjc@mail.neu.edu.cn
版权所有 :控制与决策
技术支持:北京勤云科技发展有限公司