• 2025年第40卷第5期文章目次
    全 选
    显示方式: |
    • >综述与评论
    • 低碳算法的发展及压缩和加速技术的应用

      2025, 40(5):1409-1428. DOI: 10.13195/j.kzyjc.2024.0936

      摘要 (32) HTML (11) PDF 3.40 M (21) 评论 (0) 收藏

      摘要:探讨低碳神经网络算法的设计及其在工业界和大型模型中的应用. 首先, 介绍低碳算法的概念及碳足迹视角下的深度学习算法; 随后, 深入研究多种设计策略, 如剪枝、量化、低秩分解等, 这些策略能显著降低数据中心和网络设备的资源消耗, 推动绿色计算的发展. 此外, 关注了低碳算法的实际应用, 包括低精度计算、高效硬件设计和硬件加速, 展示了其在减少能源浪费和环境影响方面的潜力. 对于大语言模型(LLMs), 讨论了训练过程中的压缩技术、模型结构优化等方法, 以降低这类高资源需求模型的环境负担. 最后, 提出了评判标准来衡量不同算法的效能, 并展望低碳算法未来的发展方向及其对可持续发展的重要意义, 旨在促进低碳算法的研究与应用, 为构建可持续的数字社会贡献力量.

    • >论文与报告
    • 基于MAPPO的多无人机协同分布式动态任务分配

      2025, 40(5):1429-1437. DOI: 10.13195/j.kzyjc.2024.0784

      摘要 (20) HTML (11) PDF 3.35 M (14) 评论 (0) 收藏

      摘要:针对多无人机在高动态近距空战中自主决策困难且协同性差等问题, 提出一种基于多智能体近端策略优化(MAPPO)的多无人机分布式动态任务分配方法. 首先, 考虑任务可执行约束和无人机载荷约束, 建立以敌方无人机为目标、攻击战术为任务的多无人机动态任务分配模型; 其次, 设计包含分离式状态滑动标准化机制、动作屏蔽机制以及注意力机制的任务重分配网络, 该网络可有效处理MAPPO算法在状态滑动标准化过程中的信息失真问题, 并确保任务分配过程严格满足任务约束, 同时可基于攻击目标专注于攻击战术的选择, 实现多无人机的协同分布式动态任务分配; 最后, 在3v3近距空战场景中, 搭载所提出算法的我方无人机与搭载空战决策专家系统的敌方无人机进行空战对抗, 其作战胜率高达98.5 %, 所得结果验证了所提出方法的有效性.

    • 基于Petri网与多智能体深度强化学习的AGV路径规划

      2025, 40(5):1438-1446. DOI: 10.13195/j.kzyjc.2023.1796

      摘要 (13) HTML (5) PDF 1.25 M (14) 评论 (0) 收藏

      摘要:在无人仓库系统中, 解决自动导引车(AGV)间的碰撞、死锁以及路径规划问题至关重要. 鉴于此, 提出一种用Petri网对仓库环境中AGV系统进行建模的方法, 以有效解决AGV运输货物时产生冲突的问题. 在此基础上, 提出一种多智能体深度强化学习AGV路径规划框架, 视AGV路径规划问题为部分可观测马尔可夫决策过程, 将深度确定性策略梯度算法扩展至多智能体系统, 通过设计AGV的观测空间、状态空间、动作空间以及奖励函数来实现Petri网中AGV无冲突路径规划. 在设置奖励函数时加入Petri网触发条件后的反馈, 以极大程度地减少AGV运输货物时拥塞的产生, 增加仓库在规定时间内的送货总量. 此外, 所提出框架将路径分支点设置为智能体, 以有效地应对多个任务起点随机产生以及环境中AGV数量时刻变化的情况, 提升神经网络泛化能力. 仿真实验在AnyLogic软件平台中进行, 通过对比不同AGV规模下的货物运输情况以及奖励函数中有无Petri网条件正负反馈的对照实验, 验证所提出路径规划方法的可行性和有效性.

    • 多列车系统数据驱动无模型自适应PID控制

      2025, 40(5):1447-1456. DOI: 10.13195/j.kzyjc.2024.0836

      摘要 (13) HTML (8) PDF 4.07 M (14) 评论 (0) 收藏

      摘要:针对一类多列车系统, 提出一种具有牵引力/制动力约束以及追尾防护功能的分布式无模型自适应PID (MFAPID)控制方案. 首先, 通过动态线性化方法将列车的动力学模型转化为等价的动态线性化数据模型; 其次, 通过引入饱和函数以及避碰反馈机制, 利用I/O数据设计一种带有牵引力/制动力约束和追尾防护功能的分布式MFAPID控制算法, 并通过压缩映射的方法对该算法进行严格的收敛性分析证明; 最后, 通过数值仿真对比实验验证MFAPID控制算法的有效性和稳定性.

    • 基于改进灰狼算法的冗余机械臂最优轨迹规划

      2025, 40(5):1457-1466. DOI: 10.13195/j.kzyjc.2024.1072

      摘要 (26) HTML (11) PDF 2.68 M (27) 评论 (0) 收藏

      摘要:针对冗余机械臂时间-冲击最优轨迹规划问题, 提出一种基于改进灰狼算法的最优轨迹规划器. 首先, 为了克服灰狼算法(GWO)开发与探索不平衡的局限性, 提出基于强化学习的灰狼算法(QLGWO)及其多目标版本(MOQLGWO): QLGWO使用$Q $学习指导灰狼个体基于经验和奖励选择探索或开发动作, 以实现算法局部与全局搜索的自主平衡; MOQLGWO引入存档和领导选择机制, 在搜索衡量多种优化目标的帕累托最优解的同时, 引导搜索方向朝未被探索的区域拓展, 以逼近全局最优. 然后, 使用两段五阶多项式来构造机械臂的运动轨迹, 需要搜索的解由运行时间以及中间点的关节位置、速度、加速度组成. 最后, 在12个基准函数上, 将QLGWO与GWO以及其他4种先进的元启发式算法进行对比, 并使用MOQLGWO求解9自由度冗余机械臂的时间-冲击最优轨迹规划问题. 仿真和实验结果表明: 所提出QLGWO可有效提高GWO的性能; 最优轨迹规划器能够在满足关节约束的前提下获得安全、光滑的时间-冲击最优轨迹, 其运行时间小于14 s, 冲击处于$-0.25\, {\rm rad/s}^3 \sim \rhbr 0.15\, {\rm rad/s}^3$之间.

    • 基于事件触发策略的受扰非线性系统的预设性能跟踪控制

      2025, 40(5):1467-1473. DOI: 10.13195/j.kzyjc.2024.0835

      摘要 (19) HTML (4) PDF 3.11 M (22) 评论 (0) 收藏

      摘要:研究一类受扰非线性系统基于事件触发策略的预设性能跟踪控制问题. 引入非线性扰动观测器以获得系统中未知扰动的估计, 同时在控制设计中引入一个具有时变衰减率的预设性能函数. 借助于指令滤波和迭代设计算法, 构造一种事件触发预设性能跟踪控制器, 不仅保证了跟踪误差始终满足预设性能指标, 而且具备良好的扰动抑制能力. 所使用的具有时变衰减率的性能函数与传统常值衰减率的性能函数相比, 有效避免了初始阶段控制量过大的问题. 最后, 通过数值仿真验证了所提方法的有效性.

    • 基于模糊人工势场法的智能助行器人机共享控制策略

      2025, 40(5):1474-1484. DOI: 10.13195/j.kzyjc.2024.1133

      摘要 (9) HTML (5) PDF 10.30 M (14) 评论 (0) 收藏

      摘要:在智能助行器对有行走障碍的用户进行助力、跟随以及安全防护的过程中, 智能助行器的主动避障行为是十分重要的. 鉴于此, 提出一种基于模糊人工势场法(FAPF)的智能助行器人机共享控制策略, 适用于智能助行器的局部路径规划需求. FAPF对传统人工势场法(APF)进行优化, 减少APF易陷入局部最小值和目标不可达的情况出现, 并引入模糊自适应对APF斥力增益系数进行整定, 以满足智能助行器在实际中的应用需求, 提高算法的稳定性. FAPF在Matlab仿真平台进行实验, 仿真实验表明, FAPF能够安全地避开障碍物, 目标点到达率为89.7 %, 并增强智能助行器在复杂环境中的轨迹平滑度. 同时, 在智能助行器上的应用实验表明了FAPF的可行性和实用性, 部署FAPF后, 智能助行器能够在跟随用户行走过程中主动避开障碍物, 引导用户选择更加安全的路径.

    • 切换拓扑下多智能体系统的固定/预定时间优化一致性

      2025, 40(5):1485-1493. DOI: 10.13195/j.kzyjc.2024.0906

      摘要 (8) HTML (5) PDF 2.14 M (19) 评论 (0) 收藏

      摘要:研究切换拓扑下多智能体系统的固定/预定时间优化问题, 提出基于指数函数的分布式固定/预定时间优化算法. 首先, 所提出算法由两个阶段构成: 第1阶段确保智能体的状态在固定/预定时间内收敛至各自的局部最优状态, 从而消除零梯度和算法对系统初始状态位于其局部最优解处的要求; 第2阶段实现智能体的状态在固定/预定时间内收敛至优化问题的全局最优解. 然后, 利用凸优化理论、Lyapunov稳定性理论, 分析算法在通信拓扑切换下的收敛性. 所提出的两种算法均无需交换梯度以及Hessian矩阵信息, 其设计不依赖符号函数, 且所需参数较少. 最后, 通过数值仿真验证上述理论结果.

    • 基于混合事件触发机制的多智能体系统有限时间包容控制

      2025, 40(5):1494-1502. DOI: 10.13195/j.kzyjc.2024.0803

      摘要 (10) HTML (2) PDF 1.37 M (9) 评论 (0) 收藏

      摘要:针对多智能体系统包容控制中跟随者和领导者存在的通信资源受限问题, 提出一种基于混合事件触发机制的有限时间包容控制方法, 将多智能体系统中的事件触发机制由跟随者拓展应用于领导者. 首先, 分别为跟随者和领导者设计专属的事件触发函数, 以实现跟随者的事件触发式的通信以及控制器更新, 同时, 实现领导者的事件触发式通信; 然后, 在触发函数中设计状态依赖的自适应参数, 可动态地调整触发阈值, 减少事件触发序列; 接着, 将所提出方法应用于有向拓扑结构下的包容控制问题, 可令跟随者在有限时间内不断地跟踪上凸包中的目标点, 并使其能够保持在动态变化的凸包中, 且由于滑模控制的存在使得收敛过程更具鲁棒性; 最后, 通过仿真表明所提出方法的有效性.

    • 基于联合对抗域自适应网络的跨工况故障诊断方法

      2025, 40(5):1503-1511. DOI: 10.13195/j.kzyjc.2024.0767

      摘要 (6) HTML (2) PDF 3.13 M (6) 评论 (0) 收藏

      摘要:针对机床零部件在实际场景中难以获得带标签的故障数据, 且训练数据与测试数据分布不一致导致诊断模型不适用的问题, 提出一种基于联合对抗域自适应网络(JADAN)的跨工况故障诊断方法. 首先, 利用对抗域自适应训练来提取源域和目标域的深层域不变特征, 以提高诊断模型在目标域的泛化能力; 其次, 提出一种基于Softmax预测和结构化预测的伪标签策略, 使模型能够为无标签的目标域数据生成伪标签; 同时, 加入类对齐模块, 最小化源域和目标域之间的类原型距离, 实现域与类的联合对齐, 有效减少决策边界附近样本被错误分类的概率; 然后, 在域判别器中引入源域样本的权重分配机制, 为每个源域样本自适应地分配权重, 有效解决模型训练过程中的负迁移问题, 提升模型的鲁棒性; 最后的实验结果表明, 所提出的方法能够更有效地解决跨工况故障诊断问题.

    • 基于自适应双阶段分级均衡的约束高维多目标进化算法

      2025, 40(5):1512-1522. DOI: 10.13195/j.kzyjc.2024.0288

      摘要 (10) HTML (4) PDF 2.04 M (10) 评论 (0) 收藏

      摘要:为了提高约束进化算法处理各种不同约束高维多目标优化问题的精确性和鲁棒性, 提出一种基于自适应双阶段分级均衡的约束高维多目标进化算法. 该算法将多阶段优化方法与混合约束处理技术相结合, 首先通过动态个体支配关系设计分段时机, 并自适应地切换进化过程的目标优化和约束处理两个阶段; 然后依据种群进化信息构建混合分级均衡准则, 利用自适应随机排序法在不可行状态选择个体, 并在半可行状态下定义半可行性准则以选择个体, 从而保持可行解与不可行解的动态均衡, 提高种群的收敛性、分布性和多样性. 在标准测试函数集C_DTLZ、DC_DTLZ和MW的大量实验结果表明, 所提出的算法对不同目标维数以及狭窄、离散或互不连通可行域的约束高维多目标问题均能取得较好的收敛性能和稳定性, 相对于MOEA/D-FCHT、MOEA/D-2WA、PPS、ToP和Trip五种先进方法, 具有更高的收敛精度和更好的鲁棒性.

    • 基于分层自主决策和DQN的自适应牧羊控制方法

      2025, 40(5):1523-1532. DOI: 10.13195/j.kzyjc.2024.0634

      摘要 (6) HTML (2) PDF 1.32 M (5) 评论 (0) 收藏

      摘要:牧羊控制方法逐渐被应用于机场鸟群驱离、无人机放牧、空地协同监视和引导等大规模集群运动协调问题. 以牧羊无人机为例, 提出基于分层自主决策和深度$Q $网络(DQN)的自适应牧羊控制方法. 首先, 考虑离群个体活跃度衰减等因素, 建立牧羊控制问题的感知和运动模型; 然后, 针对个体滞留和离群问题, 提出基于全局质心的弧形轨迹(GCM-Arc)控制方法和避障策略, 提升羊群受控个体占比; 最后, 建立分层自主决策模型, 结合GCM-Arc控制方法与深度$Q $网络, 提出分层GCM-Arc控制方法, 以实现控制模式自适应切换和参数自适应调整. 数字仿真实验表明, 所提出方法在牧羊任务时间、无人机总路程、羊群平均半径、单体离群率和牧羊任务成功率方面, 明显优于经典的两种牧羊控制方法.

    • 基于迹距离划分决策树的高炉故障诊断方法

      2025, 40(5):1533-1540. DOI: 10.13195/j.kzyjc.2024.0843

      摘要 (8) HTML (1) PDF 3.15 M (4) 评论 (0) 收藏

      摘要:随着工业自动化和智能化的发展, 决策树模型在高炉故障诊断领域得到了广泛应用, 但对于炼铁过程中存在高维度、非线性和强耦合的特点, 传统决策树模型的构建容易陷入局部最优解, 效率较低且复杂度较高. 针对这些问题, 首先引入迹距离函数, 并证明在迹距离函数中任何局部最优解也是全局最优解的性质; 接着针对决策树的节点分裂过程, 提出一种基于迹距离划分的决策树模型, 记作TraceTree. 此模型一方面可以更快速地评价一个节点的划分效果, 有效降低决策树模型的复杂度; 另一方面能够识别出对故障诊断最有贡献的特征参数并获得更高的诊断精度. 与其他改进模型的对比实验结果表明, 所提出的模型在更短的训练时间内能取得最优的高炉故障诊断效果, 及时地对高炉炉况进行监测与诊断.

    • 基于学生t核的最大相关熵卡尔曼滤波及其核带宽自适应选择方法

      2025, 40(5):1541-1550. DOI: 10.13195/j.kzyjc.2024.0422

      摘要 (12) HTML (3) PDF 1.16 M (13) 评论 (0) 收藏

      摘要:研究时变厚尾非高斯噪声系统的状态估计问题. 基于最大相关熵准则的卡尔曼滤波算法具有计算负担小且能够抑制多种类型非高斯噪声的特点, 现有方法大多采用高斯核函数进行设计, 且现有核带宽自适应选取能力有限. 针对现有方法存在的问题, 首先, 采用学生$t $核函数替代现有方法中常用的高斯核函数以更加充分地利用非高斯噪声的厚尾分布信息, 进而定义一种新的代价函数, 并推导出一种基于学生$t $核的最大相关熵卡尔曼滤波; 然后, 针对所提出算法的单一固定核带宽在面对非高斯噪声特性时变时估计精度下降的问题, 引入交互多模型框架来实现对多个核带宽的自适应选择, 通过运行多个具有不同核带宽的子滤波器, 利用似然函数更新不同子滤波器的概率, 并利用每个子滤波器估计值的加权融合得到最后的后验估计; 最后, 通过目标跟踪的仿真实验表明, 所提出算法与同类算法相比具有更好的估计精度.

    • 考虑高阶拓扑结构的无人蜂群任务协同能力研究

      2025, 40(5):1551-1560. DOI: 10.13195/j.kzyjc.2024.0710

      摘要 (4) HTML (1) PDF 2.34 M (7) 评论 (0) 收藏

      摘要:无人蜂群作战是未来智能化战争的典型作战样式, 鉴于此, 立足于无人蜂群的高阶拓扑结构, 研究蜂群内的信息流和控制流形成的不同拓扑结构的信息网络在面向复杂协同任务时其协同能力的变化. 依据无人蜂群群体智能的关联规则, 将无人蜂群信息网络设计为模块化的社团网络, 搭建最近邻耦合网络、随机网络、小世界网络和无标度网络4种模块内网络模型, 以及随机连接和择优连接两种模块间关联关系, 借助超图构建任务协作组成的协同超边; 结合高阶网络的超度、超度分布、同步指数等拓扑指标综合评估蜂群协同的质量和效率, 并进行仿真实验. 实验结果表明, 择优连接的小世界网络模型在设定任务下能够更好地兼顾协同质量和协同效率, 提高无人蜂群的任务协同能力.

    • 基于向量映射代理模型的分布式柔性作业车间调度算法

      2025, 40(5):1561-1570. DOI: 10.13195/j.kzyjc.2024.0965

      摘要 (5) HTML (3) PDF 4.00 M (9) 评论 (0) 收藏

      摘要:随着定制化制造需求的增加, 分布式柔性作业调度问题涉及的调度任务复杂多变, 多产线制造设备动态重构, 人机料法环协同约束倍增. 面对多场景任务调度需求, 单一进化算法难以适应不同场景, 且由于算法对这类复杂约束问题评估时间成本较高, 逐场景调用算法生成调度方案十分耗时. 为解决这一问题, 建立分布式柔性作业车间调度问题数学模型, 并提出基于向量映射代理模型(VMSM)的调度算法. VMSM通过高维特征向量映射进行特征提取, 以增强对历史相似问题的识别能力, 并在进化算法中辅助生成初始解和评估解集, 提高搜索效率. 实验结果表明, 所提出的方法能够将相似调度方案的分类准确率提升25 % $ \sim $ 35 %, 有效减少进化算法初始解筛选和解集评估次数. 在不同场景复杂度下, VMSM均能在保障调度方案质量的前提下, 显著提高分布式柔性作业车间调度方案生成速度, 方案生成时间最多缩短51.26 %.

    • 基于注意力预训练自编码器的无人机集群干扰资源分配方法

      2025, 40(5):1571-1580. DOI: 10.13195/j.kzyjc.2024.0814

      摘要 (4) HTML (1) PDF 1.63 M (3) 评论 (0) 收藏

      摘要:干扰资源分配作为认知电子战的重要环节之一, 旨在干扰资源有限的情况下, 通过合理分配干扰资源达到最大的干扰效益. 针对通信、导航受限的拒止条件下, 无人机集群协同干扰多个可移动通信目标时由于环境状态空间过大以及环境非平稳导致多智能体强化学习(MARL)算法决策性能较差的问题, 提出一种基于自注意力机制的预训练自编码器(APSE), 并将其作为MARL算法的前置单元对环境状态进行特征提取和降维, 同时, 通过集中式训练分布式执行范式来降低环境非平稳对算法决策性能的影响. 在所建立无人机集群协同干扰仿真环境中的实验结果表明: 加入APSE后的MARL算法在平均奖励和干扰资源分配效能上提升明显. 其中: 多智能体近端策略优化算法MAPPO-APSE在各项指标上表现最优, 相比于MAPPO, 其在有效干扰占空比更长的情况下干扰资源消耗量降低了20 %.

    • 基于奇异摄动的复杂工业过程强化学习运行优化控制

      2025, 40(5):1581-1589. DOI: 10.13195/j.kzyjc.2024.0700

      摘要 (3) HTML (3) PDF 4.21 M (11) 评论 (0) 收藏

      摘要:复杂工业过程往往存在快、慢耦合动态特性, 应用常规的串级设计思路难以保障整体运行优化性能, 而现有整体设计运行优化控制的方法容易发生“维数灾”和“病态数值”问题. 鉴于此, 聚焦一类设备单元和运行过程模型参数皆未知的复杂工业过程, 提出一种基于奇异摄动的快慢并行强化学习组合非串级运行优化控制方法. 首先, 引入收敛因子将复杂工业过程运行优化控制问题建模为双时间尺度系统的非串级最优控制问题; 其次, 使用奇异摄动理论将原始最优问题分解为降阶快子系统最优调节和慢子系统最优设定值跟踪问题; 然后, 在强化学习的框架下, 设计数据驱动的迭代算法学习快、慢子系统最优控制器, 进而构造不依赖于系统模型的组合最优控制策略. 与现有方法相比, 所提出运行优化算法不仅能解决设备单元模型参数未知问题, 还能实现对期望运行指标的零误差渐近跟踪. 最后, 通过赤铁矿混合选别浓密过程对比实验验证所提出方法的有效性和先进性.

    • 基于结构分析与极限学习机的牵引传动系统多传感器故障实时联合诊断方法

      2025, 40(5):1590-1598. DOI: 10.13195/j.kzyjc.2024.0403

      摘要 (6) HTML (4) PDF 4.01 M (14) 评论 (0) 收藏

      摘要:针对目前牵引传动系统传感器故障诊断中存在的诊断对象单一、传感器信号间强耦合性未充分考虑可能导致的误报问题, 提出一种多传感器故障联合实时诊断方法. 首先, 分析基于现有传感器布局的可诊断性, 并构建可实现所有传感器故障可隔离的结构最小型超定方程集(MSOs)和故障特征矩阵; 其次, 基于每个MSO对应的传感器信号集和相关系统机理知识, 确定数据驱动模型的输入输出信号、模型输入信号的阶次以及不同输入信号间的关联关系; 接着, 利用极限学习机算法, 基于历史正常数据样本建立每个MSO的数据驱动模型, 实现其输出值的有效估计, 并生成残差序列, 并结合故障特征矩阵实现不同传感器故障的有效检测与诊断; 最后, 采用半实物仿真与现场故障场景录波的虚实联合测试验证平台对所提出诊断算法进行测试验证. 验证结果表明, 与现有方法相比, 所提出方法能够实现牵引传动系统多传感器故障的快速检测与定位, 具有良好的工程应用价值.

    • 基于低密度分数的密度峰值聚类算法

      2025, 40(5):1599-1609. DOI: 10.13195/j.kzyjc.2024.0963

      摘要 (4) HTML (2) PDF 13.65 M (12) 评论 (0) 收藏

      摘要:密度峰值聚类算法 (DPC) 可识别出任意形状的簇, 但是对于存在多密度峰值的簇, DPC可能会识别出多个簇中心点, 导致簇划分错误. 鉴于此, 提出一种基于低密度分数的密度峰值聚类算法 (LS-DPC). 该算法首先使用低密度分数放大数据点的密度差异, 缩小整体密度差异大的相邻区域的密度差异, 使得单个簇内所有区域的密度分布均重构为单峰密度分布; 然后, 根据低密度分数自动获得子簇中心点; 接着, 得到子簇后, 根据密度相交条件对子簇进行融合, 完成聚类; 最后, 将所提出LS-DPC算法与$k $-Means、SC、DPC、DN、Extreme以及ICKDP算法进行对比, 实验结果表明所提出算法在复杂数据集和UCI数据集上的表现优于对比算法.

    • 考虑数据不确定性的鲁棒交叉效率DEA方法及其应用

      2025, 40(5):1610-1618. DOI: 10.13195/j.kzyjc.2024.0825

      摘要 (11) HTML (4) PDF 717.09 K (11) 评论 (0) 收藏

      摘要:数据包络分析(DEA)是一种评价决策单元相对效率的数学规划模型, 在管理决策领域得到了广泛应用. 传统交叉DEA方法高度依赖于真实且准确的数据. 当数据存在不确定性时, 确定性假设下得到的DEA模型解可能会失去可行性, 从而使得效率评价结果不可靠. 针对这一问题, 首先, 基于鲁棒优化方法, 提出一种鲁棒交叉效率DEA模型, 其中为了避免多重最优解造成的交叉效率值不唯一问题, 进一步建立二级目标模型来选择一组可接受的最优解; 然后, 引入鲁棒价格的概念来分析决策单元应对数据不确定性的能力, 并在此基础上探讨仁慈型和对抗型两种交叉策略的选择问题; 最后, 基于15个OECD国家的可再生能源数据, 验证所构建方法的可行性和有效性.

    • 基于角分解辅助的多阶段高维多目标进化算法

      2025, 40(5):1619-1630. DOI: 10.13195/j.kzyjc.2024.0718

      摘要 (9) HTML (1) PDF 2.15 M (6) 评论 (0) 收藏

      摘要:针对大多数现存高维多目标进化算法仍无法在高维空间中有效平衡种群收敛性与多样性的问题, 提出一种基于角分解辅助的多阶段高维多目标进化算法(AMEA). 该算法协作角分解机制与多阶段自适应删除策略逐一淘汰种群中性能较差的个体, 进而平衡种群的收敛性和多样性. 前者选取一对夹角最小的个体, 其意味着它们最为相似; 后者根据种群的进化状态自适应地淘汰这对个体中性能较差的个体. 当种群处于未收敛于Pareto前沿状态时, 删除策略淘汰收敛性较差的个体, 以加速种群收敛. 如果这对个体具有相同的收敛性, 删除策略则淘汰多样性较差的个体. 反之, 删除策略利用所设计的综合性能指标来淘汰收敛性和多样性都较差的个体, 以提升种群的综合性能. 此外, 所提出算法设计了基于径向空间投影的匹配选择策略来选取收敛性和多样性都良好的父代个体进入匹配池, 进而提高算法探索高维空间的能力. 实验结果表明, AMEA在处理高维多目标优化问题时具有较强的竞争力, 能有效地平衡种群的收敛性与多样性.

    • 一种面向压电微动台的增强型鸽群优化分数阶控制策略

      2025, 40(5):1631-1640. DOI: 10.13195/j.kzyjc.2024.0917

      摘要 (5) HTML (0) PDF 1.87 M (3) 评论 (0) 收藏

      摘要:针对压电微动台的非线性特性以及多轴解耦控制挑战, 提出一种基于动态相互学习策略的改进型鸽群优化算法(PIO), 并提出结合分数阶控制(FOPID)的DMLPIO-FOPID的控制策略进行实验研究. 首先, 对压电微动台进行力学分析, 使其非线性特性近似线性化; 然后, 根据动态相互学习策略建立动态相反学习种群, 以提升鸽群优化算法的寻优性能; 接着, 引用一种基于稀疏回归算法的迟滞辨识方法对压电微动台的迟滞逆模型进行补偿; 最后, 搭建压电微动实验平台对所设计控制器进行实验研究. 实验结果表明: DMLPIO-FOPID控制器在4种评价函数的优化测试中性能最佳, 平均领先果蝇优化与鸽群优化这两种分数阶控制器19.28 %、20.73 %; 且在搭建的压电微动台的三轴测试中, 所设计控制器均方差最小、收敛时间最短, 表明DMLPIO-FOPID控制方法有助于实现压电微动台的精密控制.

    • 基于非策略Q-learning的欺骗攻击下未知线性离散系统最优跟踪控制

      2025, 40(5):1641-1650. DOI: 10.13195/j.kzyjc.2024.0830

      摘要 (5) HTML (3) PDF 4.27 M (4) 评论 (0) 收藏

      摘要:针对多重欺骗攻击下动力学信息未知的线性离散系统, 提出一种非策略Q-learning算法解决系统的最优跟踪控制问题. 首先, 考虑加入一个权重矩阵建立控制器通信信道遭受多重欺骗攻击的输入模型, 并结合参考命令生成器构建增广跟踪系统. 在线性二次跟踪框架内将系统的最优跟踪控制表达为欺骗攻击与控制输入同时参与的零和博弈问题. 其次, 设计一种基于状态数据的非策略Q-learning算法学习系统最优跟踪控制增益, 解决应用中控制增益不能按照给定要求更新的问题, 并证明在满足持续激励条件的探测噪声下该算法的求解不存在偏差. 同时考虑系统状态不可测的情况, 设计基于输出数据的非策略Q-learning算法. 最后, 通过对F-16飞机自动驾驶仪的跟踪控制仿真, 验证所设计非策略Q-learning算法的有效性以及对探测噪声影响的无偏性.

    • 基于Conv-Seq2Seq模型的含弹性资源电力系统日前调度方法

      2025, 40(5):1651-1659. DOI: 10.13195/j.kzyjc.2024.0952

      摘要 (2) HTML (0) PDF 1.78 M (5) 评论 (0) 收藏

      摘要:针对新能源大规模并网带来的消纳问题, 提出一种考虑源荷双侧弹性资源的日前调度方法. 首先, 对深度调峰机组、可平移负荷和可削减负荷的弹性调节能力进行分析, 建立含弹性资源的电力系统调度模型; 然后, 提出一种基于Conv-Seq2Seq (convolutional sequence to sequence)模型的日前调度方法, 使用多层卷积神经网络作为编码器对负荷预测数据等信息进行提取, 改进深度学习网络信息提取的能力和速度, 并使用门控循环单元作为解码器对编码器提取的信息进行解码, 以输出调度计划; 最后, 通过辅助决策修正来确保调度计划的安全性. 基于改进的IEEE39节点算例验证所提出方法的有效性和正确性.

    • 运动动力学约束下基于自适应参数的运动规划方法

      2025, 40(5):1660-1668. DOI: 10.13195/j.kzyjc.2024.0676

      摘要 (5) HTML (1) PDF 4.46 M (5) 评论 (0) 收藏

      摘要:稳定稀疏探索树(SST)是一种基于采样的渐近最优运动规划算法, 与传统的渐近最优算法RRT*相比, SST采用随机前向传播来生成新节点, 无需求解两点边值问题(BVP), 即可直接规划出一条满足机器人运动学和动力学约束的可行轨迹. 针对SST对参数敏感、难以适应复杂多变的环境等问题, 提出一种基于自适应参数的SST算法(ASST), 利用规划过程中的节点碰撞率和节点密度等已知信息, 对节点所处的环境区域和邻居信息进行估计, 自适应地改变节点选择半径和节点剪枝半径. 最后, 对多种系统动态和复杂环境类型进行了仿真验证, 仿真结果表明该算法能降低对参数的依赖性, 在复杂困难环境中能够提高求解成功率和计算效率, 对不同规划问题具有较强的适应性.

    • 概率约束下基于观测器的高效模型预测控制

      2025, 40(5):1669-1676. DOI: 10.13195/j.kzyjc.2024.0770

      摘要 (7) HTML (1) PDF 877.57 K (6) 评论 (0) 收藏

      摘要:提出一种随机模型预测控制(SMPC)算法, 适用于具有有界加性噪声和不完整状态信息的线性离散时间系统. 首先, 假设噪声的一阶矩和二阶矩已知, 利用Chebyshev-Cantelli不等式将施加在状态和输入上的概率约束重新表述为确定性形式; 然后, 在高效模型预测控制(EMPC)的框架下设计基于观测器的输出反馈控制器; 接着, 引入附加的摄动量, 采用“离线计算、在线综合”的方法最大化初始可行域并计算控制律; 最后, 给出一个平均渐近性能指标的上界, 验证所提出算法的递推可行性. 仿真结果表明了所提出算法的有效性.

    • 聚合博弈的差分隐私分布式算法: 一种Frank-Wolfe方法

      2025, 40(5):1677-1686. DOI: 10.13195/j.kzyjc.2024.0972

      摘要 (4) HTML (1) PDF 2.68 M (10) 评论 (0) 收藏

      摘要:考虑聚合博弈的隐私保护分布式纳什均衡寻求算法设计. 特别地, 考虑该博弈不存在中心节点, 在这种情况下, 每个玩家无法直接获得用于策略更新所需的聚合策略信息, 采用动态跟踪一致性协议对其进行估计, 其中玩家用于估计聚合策略的状态量被认为是需要保护的敏感信息. 为了保护玩家的隐私, 利用相互独立的高斯噪声对玩家的梯度信息进行干扰. 通过将Frank-Wolfe方法与动态跟踪一致性协议相结合, 设计时变通信拓扑下带约束聚合博弈的分布式纳什均衡寻求算法. 进而, 分析算法实现$(\epsilon,\delta)$-差分隐私的方差界. 此外, 通过对聚合项估计误差的收敛性分析得到算法收敛的充分条件, 给出算法的收敛性证明. 最后, 通过数值仿真验证了所提出算法的有效性和收敛速度更快的优越性.

    • 基于PLTS的服务型制造设备维护决策方法研究

      2025, 40(5):1687-1694. DOI: 10.13195/j.kzyjc.2024.0927

      摘要 (2) HTML (0) PDF 875.71 K (6) 评论 (0) 收藏

      摘要:在服务型制造的背景下, 设备维护策略选择面临复杂性和不确定性, 这使得传统方法难以有效应对, 从而影响维护成本和设备可用性. 当前, 设备维护决策中的多指标评价信息往往具有模糊性和不确定性, 依赖传统方法难以提供科学、合理的维护方案. 针对这一问题, 引入概率语言术语集(PLTS)的分析模型, 提出3种基于概率语言术语集的加权幂平均算子, 用于整合指标权重已知和未知情况下的多指标的评价信息, 以有效应对维护决策中的不确定性和模糊性. 通过应用所提出方法, 验证其在服务型制造供应链设备维护策略选择中的可行性和有效性, 提供一种更科学的维护策略决策工具, 有助于提升维护成本的控制和设备的稳定性.

    • 基于规则约减与激活因子的扩展置信规则库推理模型

      2025, 40(5):1695-1704. DOI: 10.13195/j.kzyjc.2024.1063

      摘要 (4) HTML (0) PDF 2.02 M (6) 评论 (0) 收藏

      摘要:针对扩展置信规则库(EBRB)的规则冗余与激活规则一致性过低问题, 提出一种基于Relief算法框架的新型结构优化框架与激活因子的推理模型, 并应用于机器学习中的分类问题与回归问题. 首先, 基于Relief算法思想, 通过分析历史数据与其近邻的输入输出相关性, 赋予扩展置信规则不同的权重以识别关键规则, 并通过与近邻规则的融合实现规则约减; 然后, 在计算个体匹配度过程中引入激活因子, 通过离线优化策略确定激活因子取值, 以确保激活规则的一致性和有效性; 最后, 分别采用非线性函数与公共分类数据集对所提出方法与其他类型的EBRB模型在处理回归问题和分类问题时的表现进行对比, 结果验证了所提出模型的有效性和优越性.

    • 全部子系统均不稳定切换线性系统的有限时间混合无扰切换故障检测

      2025, 40(5):1705-1713. DOI: 10.13195/j.kzyjc.2024.0759

      摘要 (4) HTML (2) PDF 3.06 M (8) 评论 (0) 收藏

      摘要:研究全部子系统均不稳定切换线性系统在模态依赖区间驻留时间(MDIDT)切换下的有限时间混合无扰切换故障检测滤波器(FDF)设计问题. 首先, 为了改善故障检测系统的暂态性能, 提出一种直接限制切换时刻残差信号和速率信号总颠簸幅度的混合无扰切换性能描述; 然后, 通过将驻留时间区间分段, 构造保守性更低的时变离散Lyapunov函数, 得到增广系统在MDIDT切换下有限时间稳定且满足有限时间$H_\infty$性能的充分条件; 接着, 在此基础上, 给出有限时间混合无扰切换FDF的设计条件; 最后, 通过数值仿真验证所提出方法的有效性和优越性.

    • 基于解码逆向反馈调整机制的复杂产品批综合调度算法

      2025, 40(5):1714-1722. DOI: 10.13195/j.kzyjc.2024.0623

      摘要 (7) HTML (4) PDF 3.81 M (7) 评论 (0) 收藏

      摘要:针对复杂产品的批综合调度问题, 建立以最小化总完工时间为优化目标的数学模型, 提出一种基于解码逆向反馈调整机制的批综合调度算法. 该算法采用遗传算法对问题进行求解, 设计一种适应于动态组批的双层染色体编码结构, 分析了批处理设备的组批规则, 推导出确切的非组批p判断条件, 在此基础上, 提出一种兼顾单步检查组批误判和多步组批工序统一调整功能的主动解码方法. 同时, 为了进一步提高算法的性能, 又提出一种用于修正组批判断染色体串的解码逆向反馈调整机制, 实现与解码染色体的双向互动和优良信息共享. 仿真实验结果表明, 所提出算法通过采用所设计的双层染色体编码、主动解码方法和解码逆向反馈调整机制, 在解决研究问题方面明显优于其他对比算法.

    • 基于概率推理学习优化的无人自行车质量偏心校正方法

      2025, 40(5):1723-1732. DOI: 10.13195/j.kzyjc.2024.0775

      摘要 (7) HTML (1) PDF 2.55 M (11) 评论 (0) 收藏

      摘要:车体质量偏心是无人自行车一个重要的性能参数, 为了降低车体质量偏心对无人自行车航向轨迹的影响, 提出一种基于有模型强化学习原理的概率推理学习优化(PILO)偏心校正方法. 该方法以车体侧向倾角(倾角速度)、车把转角(转角速度)以及车把控制力矩为输入, 以车体侧向倾角速度(倾角加速度)以及车把转角速度(车把转角加速度)为输出, 利用高斯过程回归(GPR)构建系统的概率动态模型(PDM)表征系统的不确定性动态, 并将其用于后续的状态序列预测; 将质量偏心作为车把PD控制器的一个参数, 考虑车体航向与车把转角间的运动约束, 通过车体航向角速度构造目标函数, 优化并校正系统的质量偏心参数. 设定8种不同的负载偏心开展无人自行车仿真以及物理样机实验, 结果表明: PILO系统校正的绝对误差不超过0.005 rad, 相对误差低于10 %, 且展现了一定的抗干扰能力; 与无模型的认知学习偏心优化(RLO)校正系统相比, PILO系统在参数整定难度、智能化以及容错能力等方面具有一定优势.

    • 基于PSO-hpRPM算法的滑翔制导炮弹弹道优化

      2025, 40(5):1733-1741. DOI: 10.13195/j.kzyjc.2024.1090

      摘要 (6) HTML (1) PDF 1.04 M (4) 评论 (0) 收藏

      摘要:针对滑翔制导炮弹在坏境高动态、状态强耦合等复杂多约束情况下弹道优化效率低、优化效果不理想等问题, 提出一种基于粒子群-hp自适应Radau伪谱(PSO-hpRPM)算法的滑翔制导炮弹弹道优化方法, 该方法融合PSO算法全局搜索能力强和hpRPM算法局部优化能力出色的特点, 能够解决滑翔制导炮弹在复杂多约束情况下的弹道优化问题. 首先, 建立滑翔制导炮弹动力学模型和弹道优化问题的约束条件和目标函数; 然后, 分别采用hpRPM、PSO和PSO-hpRPM方法进行滑翔弹道优化求解, 并对3种方法进行对比研究; 最后, 为了进一步验证所提出算法的优越性, 采用灰狼优化算法(GWO)、鲸鱼(WOA)与hpRPM算法相结合, 设计GWO-hpRPM算法和WOA-hpRPM算法, 并对3种混合优化算法进行仿真对比研究. 研究结果表明: 所提出PSO-hpRPM算法在同时满足复杂多约束条件下, 优化得到的最远滑翔弹道射程为70170.75 m, 平均迭代收敛步数为6.6步, 综合性能较其他算法更佳, 优化效果良好.

    • >短文
    • 基于多分支融合嵌入式注意力特征提取的油井工况诊断

      2025, 40(5):1742-1750. DOI: 10.13195/j.kzyjc.2024.0855

      摘要 (3) HTML (2) PDF 5.07 M (11) 评论 (0) 收藏

      摘要:针对油井示功图特征提取效果不佳导致工况诊断准确率不高的问题, 提出一种基于多分支融合嵌入式注意力特征提取的油井工况诊断方法. 首先, 为使提取的示功图隐含特征信息更加全面, 在卷积自编码器的基础上, 设计多分支、多尺度的编码器结构提取, 并融合示功图位移-载荷数据的特征信息; 其次, 为强化多分支融合后的局部特征, 设计一种嵌入式通道注意力机制, 在全局平均池化基础上, 添加全局最大池化, 使其能够同时关注示功图全局和局部特征; 同时, 为进一步增强示功图关键信息的隐含特征提取能力, 在通道挤压后, 激励之前嵌入通道注意力机制模块对挤压后的通道预先进行一次权重调整, 激励后进行权重的二次调整; 最后, 将提取的特征放入长短期记忆网络模型中进行油井工况诊断. 结果表明, 基于多分支融合嵌入式注意力特征提取的油井工况诊断方法在一定程度上改善了示功图有效特征提取能力, 提高了油井工况诊断率, 能够满足油田现场的实际需求.

    • 高维度非接触磁悬浮操控系统: Maglev-Delta机器人

      2025, 40(5):1751-1760. DOI: 10.13195/j.kzyjc.2024.0870

      摘要 (4) HTML (2) PDF 2.21 M (11) 评论 (0) 收藏

      摘要:非接触操控在工业领域有着重要的应用需求, 然而, 在高维度场景下灵活快速地非接触操控仍然是业界挑战. 为此, 研究基于深度强化学习(DRL)的高维度非接触磁悬浮操控系统, 简称Maglev-Delta机器人. 首先, 从理论层面给出稳定磁悬浮操控基本条件, 提出可控区域最大化磁铁布局方案, 实现高维悬浮操控执行模块设计; 然后, 提出磁场强度非线性化弱化方法, 解决原始磁场在磁铁近处困住执行器导致DRL控制器训练样本稀缺问题; 最后, 构建兼顾移动速度和悬浮精度的奖励函数模型, 提高控制器操控性能. 实验结果表明, 所搭建Maglev-Delta机器人能够以较高的速度和精度完成二维和三维悬浮控制任务, 展现出优越的灵活性. 尤其是在模拟搬运任务中, 机器人能够稳定地完成负载搬运任务. 由实验结果推理可知, 规模化的Maglev-Delta 机器人可实现在约 $ (27 \, \text{m})^3 $ 区域内操控 $ 3.8×10^5 $ kg 重物, 展现出巨大的非接触操控应用潜力.

年第卷第

关注官微服务更及时

刊期浏览
本期排行

下载排行

摘要点击排行

引用排行