点击排行

  • 显示方式:
  • 简洁模式
  • 摘要模式
  • 1  低碳算法的发展及压缩和加速技术的应用
    赵洪科,叶倩彤,张志勇,张凯,汪珂航,黄振亚
    2025, 40(5):1409-1428. DOI: 10.13195/j.kzyjc.2024.0936
    [摘要](30) [HTML](8) [PDF 3.40 M](16)
    摘要:
    探讨低碳神经网络算法的设计及其在工业界和大型模型中的应用. 首先, 介绍低碳算法的概念及碳足迹视角下的深度学习算法; 随后, 深入研究多种设计策略, 如剪枝、量化、低秩分解等, 这些策略能显著降低数据中心和网络设备的资源消耗, 推动绿色计算的发展. 此外, 关注了低碳算法的实际应用, 包括低精度计算、高效硬件设计和硬件加速, 展示了其在减少能源浪费和环境影响方面的潜力. 对于大语言模型(LLMs), 讨论了训练过程中的压缩技术、模型结构优化等方法, 以降低这类高资源需求模型的环境负担. 最后, 提出了评判标准来衡量不同算法的效能, 并展望低碳算法未来的发展方向及其对可持续发展的重要意义, 旨在促进低碳算法的研究与应用, 为构建可持续的数字社会贡献力量.
    2  基于改进灰狼算法的冗余机械臂最优轨迹规划
    崔靖凯,王凯,范正奇,朱明超,徐振邦,刘伟东
    2025, 40(5):1457-1466. DOI: 10.13195/j.kzyjc.2024.1072
    [摘要](22) [HTML](7) [PDF 2.68 M](23)
    摘要:
    针对冗余机械臂时间-冲击最优轨迹规划问题, 提出一种基于改进灰狼算法的最优轨迹规划器. 首先, 为了克服灰狼算法(GWO)开发与探索不平衡的局限性, 提出基于强化学习的灰狼算法(QLGWO)及其多目标版本(MOQLGWO): QLGWO使用$Q $学习指导灰狼个体基于经验和奖励选择探索或开发动作, 以实现算法局部与全局搜索的自主平衡; MOQLGWO引入存档和领导选择机制, 在搜索衡量多种优化目标的帕累托最优解的同时, 引导搜索方向朝未被探索的区域拓展, 以逼近全局最优. 然后, 使用两段五阶多项式来构造机械臂的运动轨迹, 需要搜索的解由运行时间以及中间点的关节位置、速度、加速度组成. 最后, 在12个基准函数上, 将QLGWO与GWO以及其他4种先进的元启发式算法进行对比, 并使用MOQLGWO求解9自由度冗余机械臂的时间-冲击最优轨迹规划问题. 仿真和实验结果表明: 所提出QLGWO可有效提高GWO的性能; 最优轨迹规划器能够在满足关节约束的前提下获得安全、光滑的时间-冲击最优轨迹, 其运行时间小于14 s, 冲击处于$-0.25\, {\rm rad/s}^3 \sim \rhbr 0.15\, {\rm rad/s}^3$之间.
    3  基于MAPPO的多无人机协同分布式动态任务分配
    李海峰,杨宏安,盛梓茂,刘超,陈逸新
    2025, 40(5):1429-1437. DOI: 10.13195/j.kzyjc.2024.0784
    [摘要](17) [HTML](7) [PDF 3.35 M](9)
    摘要:
    针对多无人机在高动态近距空战中自主决策困难且协同性差等问题, 提出一种基于多智能体近端策略优化(MAPPO)的多无人机分布式动态任务分配方法. 首先, 考虑任务可执行约束和无人机载荷约束, 建立以敌方无人机为目标、攻击战术为任务的多无人机动态任务分配模型; 其次, 设计包含分离式状态滑动标准化机制、动作屏蔽机制以及注意力机制的任务重分配网络, 该网络可有效处理MAPPO算法在状态滑动标准化过程中的信息失真问题, 并确保任务分配过程严格满足任务约束, 同时可基于攻击目标专注于攻击战术的选择, 实现多无人机的协同分布式动态任务分配; 最后, 在3v3近距空战场景中, 搭载所提出算法的我方无人机与搭载空战决策专家系统的敌方无人机进行空战对抗, 其作战胜率高达98.5 %, 所得结果验证了所提出方法的有效性.
    4  基于事件触发策略的受扰非线性系统的预设性能跟踪控制
    王敏,孙宗耀,刘新芝,孙金生
    2025, 40(5):1467-1473. DOI: 10.13195/j.kzyjc.2024.0835
    [摘要](16) [HTML](0) [PDF 3.11 M](17)
    摘要:
    研究一类受扰非线性系统基于事件触发策略的预设性能跟踪控制问题. 引入非线性扰动观测器以获得系统中未知扰动的估计, 同时在控制设计中引入一个具有时变衰减率的预设性能函数. 借助于指令滤波和迭代设计算法, 构造一种事件触发预设性能跟踪控制器, 不仅保证了跟踪误差始终满足预设性能指标, 而且具备良好的扰动抑制能力. 所使用的具有时变衰减率的性能函数与传统常值衰减率的性能函数相比, 有效避免了初始阶段控制量过大的问题. 最后, 通过数值仿真验证了所提方法的有效性.
    5  基于学生t核的最大相关熵卡尔曼滤波及其核带宽自适应选择方法
    王国庆,张冬生,朱兆磊,杨春雨,马磊
    2025, 40(5):1541-1550. DOI: 10.13195/j.kzyjc.2024.0422
    [摘要](12) [HTML](1) [PDF 1.16 M](10)
    摘要:
    研究时变厚尾非高斯噪声系统的状态估计问题. 基于最大相关熵准则的卡尔曼滤波算法具有计算负担小且能够抑制多种类型非高斯噪声的特点, 现有方法大多采用高斯核函数进行设计, 且现有核带宽自适应选取能力有限. 针对现有方法存在的问题, 首先, 采用学生$t $核函数替代现有方法中常用的高斯核函数以更加充分地利用非高斯噪声的厚尾分布信息, 进而定义一种新的代价函数, 并推导出一种基于学生$t $核的最大相关熵卡尔曼滤波; 然后, 针对所提出算法的单一固定核带宽在面对非高斯噪声特性时变时估计精度下降的问题, 引入交互多模型框架来实现对多个核带宽的自适应选择, 通过运行多个具有不同核带宽的子滤波器, 利用似然函数更新不同子滤波器的概率, 并利用每个子滤波器估计值的加权融合得到最后的后验估计; 最后, 通过目标跟踪的仿真实验表明, 所提出算法与同类算法相比具有更好的估计精度.
    6  基于Petri网与多智能体深度强化学习的AGV路径规划
    于绍琪,田玉平
    2025, 40(5):1438-1446. DOI: 10.13195/j.kzyjc.2023.1796
    [摘要](12) [HTML](1) [PDF 1.25 M](12)
    摘要:
    在无人仓库系统中, 解决自动导引车(AGV)间的碰撞、死锁以及路径规划问题至关重要. 鉴于此, 提出一种用Petri网对仓库环境中AGV系统进行建模的方法, 以有效解决AGV运输货物时产生冲突的问题. 在此基础上, 提出一种多智能体深度强化学习AGV路径规划框架, 视AGV路径规划问题为部分可观测马尔可夫决策过程, 将深度确定性策略梯度算法扩展至多智能体系统, 通过设计AGV的观测空间、状态空间、动作空间以及奖励函数来实现Petri网中AGV无冲突路径规划. 在设置奖励函数时加入Petri网触发条件后的反馈, 以极大程度地减少AGV运输货物时拥塞的产生, 增加仓库在规定时间内的送货总量. 此外, 所提出框架将路径分支点设置为智能体, 以有效地应对多个任务起点随机产生以及环境中AGV数量时刻变化的情况, 提升神经网络泛化能力. 仿真实验在AnyLogic软件平台中进行, 通过对比不同AGV规模下的货物运输情况以及奖励函数中有无Petri网条件正负反馈的对照实验, 验证所提出路径规划方法的可行性和有效性.
    7  多列车系统数据驱动无模型自适应PID控制
    田帅涛,侯忠生
    2025, 40(5):1447-1456. DOI: 10.13195/j.kzyjc.2024.0836
    [摘要](10) [HTML](3) [PDF 4.07 M](10)
    摘要:
    针对一类多列车系统, 提出一种具有牵引力/制动力约束以及追尾防护功能的分布式无模型自适应PID (MFAPID)控制方案. 首先, 通过动态线性化方法将列车的动力学模型转化为等价的动态线性化数据模型; 其次, 通过引入饱和函数以及避碰反馈机制, 利用I/O数据设计一种带有牵引力/制动力约束和追尾防护功能的分布式MFAPID控制算法, 并通过压缩映射的方法对该算法进行严格的收敛性分析证明; 最后, 通过数值仿真对比实验验证MFAPID控制算法的有效性和稳定性.
    8  基于混合事件触发机制的多智能体系统有限时间包容控制
    朱志斌,刘忠信,王付永,陈增强
    2025, 40(5):1494-1502. DOI: 10.13195/j.kzyjc.2024.0803
    [摘要](9) [HTML](0) [PDF 1.37 M](7)
    摘要:
    针对多智能体系统包容控制中跟随者和领导者存在的通信资源受限问题, 提出一种基于混合事件触发机制的有限时间包容控制方法, 将多智能体系统中的事件触发机制由跟随者拓展应用于领导者. 首先, 分别为跟随者和领导者设计专属的事件触发函数, 以实现跟随者的事件触发式的通信以及控制器更新, 同时, 实现领导者的事件触发式通信; 然后, 在触发函数中设计状态依赖的自适应参数, 可动态地调整触发阈值, 减少事件触发序列; 接着, 将所提出方法应用于有向拓扑结构下的包容控制问题, 可令跟随者在有限时间内不断地跟踪上凸包中的目标点, 并使其能够保持在动态变化的凸包中, 且由于滑模控制的存在使得收敛过程更具鲁棒性; 最后, 通过仿真表明所提出方法的有效性.
    9  基于角分解辅助的多阶段高维多目标进化算法
    王博,刘建昌,张伟,刘圆超,谭树彬
    2025, 40(5):1619-1630. DOI: 10.13195/j.kzyjc.2024.0718
    [摘要](8) [HTML](0) [PDF 2.15 M](4)
    摘要:
    针对大多数现存高维多目标进化算法仍无法在高维空间中有效平衡种群收敛性与多样性的问题, 提出一种基于角分解辅助的多阶段高维多目标进化算法(AMEA). 该算法协作角分解机制与多阶段自适应删除策略逐一淘汰种群中性能较差的个体, 进而平衡种群的收敛性和多样性. 前者选取一对夹角最小的个体, 其意味着它们最为相似; 后者根据种群的进化状态自适应地淘汰这对个体中性能较差的个体. 当种群处于未收敛于Pareto前沿状态时, 删除策略淘汰收敛性较差的个体, 以加速种群收敛. 如果这对个体具有相同的收敛性, 删除策略则淘汰多样性较差的个体. 反之, 删除策略利用所设计的综合性能指标来淘汰收敛性和多样性都较差的个体, 以提升种群的综合性能. 此外, 所提出算法设计了基于径向空间投影的匹配选择策略来选取收敛性和多样性都良好的父代个体进入匹配池, 进而提高算法探索高维空间的能力. 实验结果表明, AMEA在处理高维多目标优化问题时具有较强的竞争力, 能有效地平衡种群的收敛性与多样性.
    10  考虑数据不确定性的鲁棒交叉效率DEA方法及其应用
    李犟,吴和成,孙婧
    2025, 40(5):1610-1618. DOI: 10.13195/j.kzyjc.2024.0825
    [摘要](8) [HTML](1) [PDF 717.09 K](8)
    摘要:
    数据包络分析(DEA)是一种评价决策单元相对效率的数学规划模型, 在管理决策领域得到了广泛应用. 传统交叉DEA方法高度依赖于真实且准确的数据. 当数据存在不确定性时, 确定性假设下得到的DEA模型解可能会失去可行性, 从而使得效率评价结果不可靠. 针对这一问题, 首先, 基于鲁棒优化方法, 提出一种鲁棒交叉效率DEA模型, 其中为了避免多重最优解造成的交叉效率值不唯一问题, 进一步建立二级目标模型来选择一组可接受的最优解; 然后, 引入鲁棒价格的概念来分析决策单元应对数据不确定性的能力, 并在此基础上探讨仁慈型和对抗型两种交叉策略的选择问题; 最后, 基于15个OECD国家的可再生能源数据, 验证所构建方法的可行性和有效性.
    11  基于模糊人工势场法的智能助行器人机共享控制策略
    赵丹丹,王亚刚,张一勤,周康寿,朱灵龙,喻洪流,孟巧玲
    2025, 40(5):1474-1484. DOI: 10.13195/j.kzyjc.2024.1133
    [摘要](8) [HTML](0) [PDF 10.30 M](9)
    摘要:
    在智能助行器对有行走障碍的用户进行助力、跟随以及安全防护的过程中, 智能助行器的主动避障行为是十分重要的. 鉴于此, 提出一种基于模糊人工势场法(FAPF)的智能助行器人机共享控制策略, 适用于智能助行器的局部路径规划需求. FAPF对传统人工势场法(APF)进行优化, 减少APF易陷入局部最小值和目标不可达的情况出现, 并引入模糊自适应对APF斥力增益系数进行整定, 以满足智能助行器在实际中的应用需求, 提高算法的稳定性. FAPF在Matlab仿真平台进行实验, 仿真实验表明, FAPF能够安全地避开障碍物, 目标点到达率为89.7 %, 并增强智能助行器在复杂环境中的轨迹平滑度. 同时, 在智能助行器上的应用实验表明了FAPF的可行性和实用性, 部署FAPF后, 智能助行器能够在跟随用户行走过程中主动避开障碍物, 引导用户选择更加安全的路径.
    12  基于概率推理学习优化的无人自行车质量偏心校正方法
    黄用华,梁子彦,庄未,任仰华
    2025, 40(5):1723-1732. DOI: 10.13195/j.kzyjc.2024.0775
    [摘要](7) [HTML](0) [PDF 2.55 M](9)
    摘要:
    车体质量偏心是无人自行车一个重要的性能参数, 为了降低车体质量偏心对无人自行车航向轨迹的影响, 提出一种基于有模型强化学习原理的概率推理学习优化(PILO)偏心校正方法. 该方法以车体侧向倾角(倾角速度)、车把转角(转角速度)以及车把控制力矩为输入, 以车体侧向倾角速度(倾角加速度)以及车把转角速度(车把转角加速度)为输出, 利用高斯过程回归(GPR)构建系统的概率动态模型(PDM)表征系统的不确定性动态, 并将其用于后续的状态序列预测; 将质量偏心作为车把PD控制器的一个参数, 考虑车体航向与车把转角间的运动约束, 通过车体航向角速度构造目标函数, 优化并校正系统的质量偏心参数. 设定8种不同的负载偏心开展无人自行车仿真以及物理样机实验, 结果表明: PILO系统校正的绝对误差不超过0.005 rad, 相对误差低于10 %, 且展现了一定的抗干扰能力; 与无模型的认知学习偏心优化(RLO)校正系统相比, PILO系统在参数整定难度、智能化以及容错能力等方面具有一定优势.
    13  概率约束下基于观测器的高效模型预测控制
    宋燕,张奕淳
    2025, 40(5):1669-1676. DOI: 10.13195/j.kzyjc.2024.0770
    [摘要](7) [HTML](0) [PDF 877.57 K](5)
    摘要:
    提出一种随机模型预测控制(SMPC)算法, 适用于具有有界加性噪声和不完整状态信息的线性离散时间系统. 首先, 假设噪声的一阶矩和二阶矩已知, 利用Chebyshev-Cantelli不等式将施加在状态和输入上的概率约束重新表述为确定性形式; 然后, 在高效模型预测控制(EMPC)的框架下设计基于观测器的输出反馈控制器; 接着, 引入附加的摄动量, 采用“离线计算、在线综合”的方法最大化初始可行域并计算控制律; 最后, 给出一个平均渐近性能指标的上界, 验证所提出算法的递推可行性. 仿真结果表明了所提出算法的有效性.
    14  基于解码逆向反馈调整机制的复杂产品批综合调度算法
    郭伟飞,杨云帆,文笑雨,杨文超,李琳利
    2025, 40(5):1714-1722. DOI: 10.13195/j.kzyjc.2024.0623
    [摘要](7) [HTML](3) [PDF 3.81 M](6)
    摘要:
    针对复杂产品的批综合调度问题, 建立以最小化总完工时间为优化目标的数学模型, 提出一种基于解码逆向反馈调整机制的批综合调度算法. 该算法采用遗传算法对问题进行求解, 设计一种适应于动态组批的双层染色体编码结构, 分析了批处理设备的组批规则, 推导出确切的非组批p判断条件, 在此基础上, 提出一种兼顾单步检查组批误判和多步组批工序统一调整功能的主动解码方法. 同时, 为了进一步提高算法的性能, 又提出一种用于修正组批判断染色体串的解码逆向反馈调整机制, 实现与解码染色体的双向互动和优良信息共享. 仿真实验结果表明, 所提出算法通过采用所设计的双层染色体编码、主动解码方法和解码逆向反馈调整机制, 在解决研究问题方面明显优于其他对比算法.
    15  基于自适应双阶段分级均衡的约束高维多目标进化算法
    王林锋,揭丽琳,黎明,何超,李军华
    2025, 40(5):1512-1522. DOI: 10.13195/j.kzyjc.2024.0288
    [摘要](7) [HTML](2) [PDF 2.04 M](6)
    摘要:
    为了提高约束进化算法处理各种不同约束高维多目标优化问题的精确性和鲁棒性, 提出一种基于自适应双阶段分级均衡的约束高维多目标进化算法. 该算法将多阶段优化方法与混合约束处理技术相结合, 首先通过动态个体支配关系设计分段时机, 并自适应地切换进化过程的目标优化和约束处理两个阶段; 然后依据种群进化信息构建混合分级均衡准则, 利用自适应随机排序法在不可行状态选择个体, 并在半可行状态下定义半可行性准则以选择个体, 从而保持可行解与不可行解的动态均衡, 提高种群的收敛性、分布性和多样性. 在标准测试函数集C_DTLZ、DC_DTLZ和MW的大量实验结果表明, 所提出的算法对不同目标维数以及狭窄、离散或互不连通可行域的约束高维多目标问题均能取得较好的收敛性能和稳定性, 相对于MOEA/D-FCHT、MOEA/D-2WA、PPS、ToP和Trip五种先进方法, 具有更高的收敛精度和更好的鲁棒性.
    16  基于迹距离划分决策树的高炉故障诊断方法
    刘亚雪,张敬川,王显鹏
    2025, 40(5):1533-1540. DOI: 10.13195/j.kzyjc.2024.0843
    [摘要](7) [HTML](0) [PDF 3.15 M](3)
    摘要:
    随着工业自动化和智能化的发展, 决策树模型在高炉故障诊断领域得到了广泛应用, 但对于炼铁过程中存在高维度、非线性和强耦合的特点, 传统决策树模型的构建容易陷入局部最优解, 效率较低且复杂度较高. 针对这些问题, 首先引入迹距离函数, 并证明在迹距离函数中任何局部最优解也是全局最优解的性质; 接着针对决策树的节点分裂过程, 提出一种基于迹距离划分的决策树模型, 记作TraceTree. 此模型一方面可以更快速地评价一个节点的划分效果, 有效降低决策树模型的复杂度; 另一方面能够识别出对故障诊断最有贡献的特征参数并获得更高的诊断精度. 与其他改进模型的对比实验结果表明, 所提出的模型在更短的训练时间内能取得最优的高炉故障诊断效果, 及时地对高炉炉况进行监测与诊断.
    17  基于结构分析与极限学习机的牵引传动系统多传感器故障实时联合诊断方法
    李学明,刘侃,陈志文,甘韦韦,成正林,蒋奉兵
    2025, 40(5):1590-1598. DOI: 10.13195/j.kzyjc.2024.0403
    [摘要](6) [HTML](2) [PDF 4.01 M](11)
    摘要:
    针对目前牵引传动系统传感器故障诊断中存在的诊断对象单一、传感器信号间强耦合性未充分考虑可能导致的误报问题, 提出一种多传感器故障联合实时诊断方法. 首先, 分析基于现有传感器布局的可诊断性, 并构建可实现所有传感器故障可隔离的结构最小型超定方程集(MSOs)和故障特征矩阵; 其次, 基于每个MSO对应的传感器信号集和相关系统机理知识, 确定数据驱动模型的输入输出信号、模型输入信号的阶次以及不同输入信号间的关联关系; 接着, 利用极限学习机算法, 基于历史正常数据样本建立每个MSO的数据驱动模型, 实现其输出值的有效估计, 并生成残差序列, 并结合故障特征矩阵实现不同传感器故障的有效检测与诊断; 最后, 采用半实物仿真与现场故障场景录波的虚实联合测试验证平台对所提出诊断算法进行测试验证. 验证结果表明, 与现有方法相比, 所提出方法能够实现牵引传动系统多传感器故障的快速检测与定位, 具有良好的工程应用价值.
    18  基于分层自主决策和DQN的自适应牧羊控制方法
    赵江,杨智,池沛,王英勋
    2025, 40(5):1523-1532. DOI: 10.13195/j.kzyjc.2024.0634
    [摘要](6) [HTML](0) [PDF 1.32 M](4)
    摘要:
    牧羊控制方法逐渐被应用于机场鸟群驱离、无人机放牧、空地协同监视和引导等大规模集群运动协调问题. 以牧羊无人机为例, 提出基于分层自主决策和深度$Q $网络(DQN)的自适应牧羊控制方法. 首先, 考虑离群个体活跃度衰减等因素, 建立牧羊控制问题的感知和运动模型; 然后, 针对个体滞留和离群问题, 提出基于全局质心的弧形轨迹(GCM-Arc)控制方法和避障策略, 提升羊群受控个体占比; 最后, 建立分层自主决策模型, 结合GCM-Arc控制方法与深度$Q $网络, 提出分层GCM-Arc控制方法, 以实现控制模式自适应切换和参数自适应调整. 数字仿真实验表明, 所提出方法在牧羊任务时间、无人机总路程、羊群平均半径、单体离群率和牧羊任务成功率方面, 明显优于经典的两种牧羊控制方法.
    19  基于联合对抗域自适应网络的跨工况故障诊断方法
    文利燕,陈金陵,姜斌,马亚杰,冯靖智
    2025, 40(5):1503-1511. DOI: 10.13195/j.kzyjc.2024.0767
    [摘要](6) [HTML](0) [PDF 3.13 M](5)
    摘要:
    针对机床零部件在实际场景中难以获得带标签的故障数据, 且训练数据与测试数据分布不一致导致诊断模型不适用的问题, 提出一种基于联合对抗域自适应网络(JADAN)的跨工况故障诊断方法. 首先, 利用对抗域自适应训练来提取源域和目标域的深层域不变特征, 以提高诊断模型在目标域的泛化能力; 其次, 提出一种基于Softmax预测和结构化预测的伪标签策略, 使模型能够为无标签的目标域数据生成伪标签; 同时, 加入类对齐模块, 最小化源域和目标域之间的类原型距离, 实现域与类的联合对齐, 有效减少决策边界附近样本被错误分类的概率; 然后, 在域判别器中引入源域样本的权重分配机制, 为每个源域样本自适应地分配权重, 有效解决模型训练过程中的负迁移问题, 提升模型的鲁棒性; 最后的实验结果表明, 所提出的方法能够更有效地解决跨工况故障诊断问题.
    20  切换拓扑下多智能体系统的固定/预定时间优化一致性
    李璐珂,甘勤涛,孙海涛
    2025, 40(5):1485-1493. DOI: 10.13195/j.kzyjc.2024.0906
    [摘要](6) [HTML](0) [PDF 2.14 M](14)
    摘要:
    研究切换拓扑下多智能体系统的固定/预定时间优化问题, 提出基于指数函数的分布式固定/预定时间优化算法. 首先, 所提出算法由两个阶段构成: 第1阶段确保智能体的状态在固定/预定时间内收敛至各自的局部最优状态, 从而消除零梯度和算法对系统初始状态位于其局部最优解处的要求; 第2阶段实现智能体的状态在固定/预定时间内收敛至优化问题的全局最优解. 然后, 利用凸优化理论、Lyapunov稳定性理论, 分析算法在通信拓扑切换下的收敛性. 所提出的两种算法均无需交换梯度以及Hessian矩阵信息, 其设计不依赖符号函数, 且所需参数较少. 最后, 通过数值仿真验证上述理论结果.

    年第卷第

    关注官微服务更及时

    刊期浏览
    本期排行

    下载排行

    摘要点击排行

    引用排行