2022, 37(11):2753-2768. DOI: 10.13195/j.kzyjc.2021.1241
摘要:循环神经网络是神经网络序列模型的主要实现形式,近几年得到迅速发展,其是机器翻译、机器问题回答、序列视频分析的标准处理手段,也是对于手写体自动合成、语音处理和图像生成等问题的主流建模手段.鉴于此,循环神经网络的各分支按照网络结构进行详细分类,大致分为3大类:一是衍生循环神经网络,这类网络是基于基本RNNs模型的结构衍生变体,即对RNNs的内部结构进行修改;二是组合循环神经网络,这类网络将其他一些经典的网络模型或结构与第一类衍生循环神经网络进行组合,得到更好的模型效果,是一种非常有效的手段;三是混合循环神经网络,这类网络模型既有不同网络模型的组合,又在RNNs内部结构上进行修改,是同属于前两类网络分类的结构.为了更加深入地理解循环神经网络,进一步介绍与循环神经网络经常混为一谈的递归神经网络结构以及递归神经网络与循环神经网络的区别和联系.在详略描述上述模型的应用背景、网络结构以及模型变种后,对各个模型的特点进行总结和比较,并对循环神经网络模型进行展望和总结.
2022, 37(11):2769-2778. DOI: 10.13195/j.kzyjc.2021.0381
摘要:随着六足机器人遥操作系统研究工作的日趋深入,针对其操控系统的开发也将面临诸多挑战.为了实现双人操控条件下各操作者的控制权重实时分配,设计一种基于透明性及控制状态(TCS)的六足机器人双用户控制权重分配方法.其双主端与单从端采取位置-速度的交互模式,通过分析系统实时透明性与当前控制状态,构建三边遥操作控制律,实时计算共享因子,采用速度跟踪模式设计基于触觉力反馈的系统控制架构,并利用三端口绝对稳定定理确定控制律参数的稳定范围.最后,搭建半物理仿真实验平台并验证所设计的三边共享遥操作方法能够在兼顾系统安全性与透明性的同时以较高的效率与安全性实现六足机器人的双用户操控,并能充分考虑双用户的控制意图.
2022, 37(11):2779-2789. DOI: 10.13195/j.kzyjc.2021.0567
摘要:空间机器人在捕获卫星操作过程中会发生剧烈碰撞,若不对其脆弱的关节进行保护,则可能造成空间机器人的损坏.为此在空间机器人关节电机与机械臂之间加入一种弹簧阻尼机构,该机构不仅可以在碰撞过程中缓冲、吸收冲击能量,而且可以通过设计与之配合的柔顺策略实现混合体系统的镇定控制.首先,针对捕获前的双臂空间机器人开环系统与目标卫星系统,分别利用Lagrange法与Newton-Euler法建立分体系统动力学模型; 结合动量定理、速度约束、闭链几何约束及牛顿第三定律,导出捕获后的闭链混合体系统动力学模型,并计算冲击效应与碰撞力;然后,针对混合体系统的控制问题,提出一种配合弹簧阻尼机构的积分终端滑模控制方案,通过灰狼优化算法对滑模控制器的参数进行优化,实现混合体系统快速、稳定的镇定控制;最后,利用Lyapunov定理证明系统的稳定性,并通过数值仿真验证缓冲机构的抗冲击性能与柔顺策略的有效性.
2022, 37(11):2790-2798. DOI: 10.13195/j.kzyjc.2021.0421
摘要:针对具有典型非线性特性的多关节机器人轨迹跟踪控制问题,提出一种基于径向基函数(RBF)神经网络的固定时间滑模控制方法.首先,基于凯恩方法建立包括系统模型不确定性以及外部干扰在内的多关节机器人动力学模型;然后,根据机器人动力学模型设计一种固定时间收敛的滑模控制器,RBF神经网络用来逼近系统模型中的不确定性项,并利用Lyapunov理论证明该系统跟踪误差能在固定时间内收敛;最后,对特定型号的多关节机器人虚拟样机进行仿真分析,结果表明:与基于RBF神经网络的有限时间滑模控制器相比,所提出控制器具有良好的跟踪性能且能保证系统状态在固定时间内收敛.
2022, 37(11):2799-2807. DOI: 10.13195/j.kzyjc.2021.1013
摘要:针对现有基于深度强化学习(deep reinforcement learning, DRL)的分层导航方法在包含长廊、死角等结构的复杂环境下导航效果不佳的问题,提出一种基于option-based分层深度强化学习(hierarchical deep reinforcement learning,HDRL)的移动机器人导航方法.该方法的模型框架分为高层和低层两部分,其中低层的避障和目标驱动控制模型分别实现避障和目标接近两种行为策略,高层的行为选择模型可自动学习稳定、可靠的行为选择策略,从而有效避免对人为设计调控规则的依赖.此外,所提出方法通过对避障控制模型进行优化训练,使学习到的避障策略更加适用于复杂环境下的导航任务.在与现有DRL方法的对比实验中,所提出方法在全部仿真测试环境中均取得最高的导航成功率,同时在其他指标上也具有整体优势,表明所提出方法可有效解决复杂环境下导航效果不佳的问题,且具有较强的泛化能力.此外,真实环境下的测试进一步验证了所提出方法的潜在应用价值.
2022, 37(11):2808-2817. DOI: 10.13195/j.kzyjc.2021.0131
摘要:一般的高维多目标进化算法无法有效处理不同类型的Pareto前沿. 针对这一情况,提出一种基于种群关联策略和强化解集准则的高维多目标进化算法(many-objective evolutionary algorithm based on population association strategy and enhanced solution set criterion,MaOEA/PAS-ESC).该算法在环境选择中采用种群关联策略(population association strategy,PAS)和强化解集准则(enhanced solution set criterion,ESC)协同指导种群进化.PAS利用解与参考向量的角度和欧氏距离以及种群中解之间的距离构建角度与距离联合函数(joint function of angle and distance,JFAD),选择多样性良好的解,然后ESC利用参考点与种群间的联系组成适应度函数,选择收敛性良好的解,以共同达到有效平衡多样性和收敛性的目的.实验结果表明,采用MaOEA/PAS-ESC处理高维多目标优化问题具有更强的竞争性能,而且提高了处理不同类型Pareto前沿的能力.
2022, 37(11):2818-2826. DOI: 10.13195/j.kzyjc.2021.0440
摘要:针对火箭壳体加工车间新订单连续到达,排产方案重构频繁导致重构时间花销大、排产方案低效等问题,首先建立虚拟单元重构的多目标规划模型,以多批订单总生产时间、运输设备总运输距离以及车间生产设备负荷均衡因素为目标函数,以车间设备加工能力和火箭壳体加工工艺限制为约束条件;其次提出一种改进的NSGA-II算法对模型进行优化求解,针对NSGA-II算法局部搜索能力的不足,在NSGA-II算法交叉过程中引入“首次改进”和“随机改进”两种局部搜索策略,提高该算法的局部搜索能力;最后基于超体积、均匀性两个多目标评价指标对提出的改进NSGA-II算法与传统的NSGA-II算法以及NSGA-III算法进行比较,结合实例验证了改进NSGA-II算法在进行火箭壳体虚拟单元重构时更加高效.
2022, 37(11):2827-2838. DOI: 10.13195/j.kzyjc.2021.0618
摘要:工业互联网背景下,工业控制系统面临攻击防不住、脆弱性易暴露的安全挑战,要保障系统安全稳定运行,首先需要深入探究引发工业控制系统故障的原因,明确系统脆弱性机理.针对当前单点或局部脆弱性分析的局限性,面向工业控制系统全生命周期安全需求及特征,提出脆弱性多维协同分析框架,通过模型驱动的系统静态、动态脆弱性分析以及多域融合评估,剖析和挖掘系统脆弱点及其关联渗透过程,生成系统脆弱性知识.所提出框架首次明确脆弱性含义,同时全生命周期需求覆盖以及一体化架构特性有助于实现系统全局脆弱性机理揭示.
2022, 37(11):2839-2848. DOI: 10.13195/j.kzyjc.2021.0645
摘要:灰狼优化(grey wolf optimization,GWO)算法是一种基于群体智能的随机优化算法,已成功地应用于许多复杂的优化问题的求解.尽管GWO算法有很多改进形式,但缺少严谨的收敛性分析,导致改进后的算法不具备理论支撑.对此,运用鞅论分析其收敛性.首先,根据GWO算法原理建立其基本的数学模型,通过定义灰狼状态空间及灰狼群状态空间,建立GWO算法的Markov链模型,并分析该算法的Markov性质;其次,介绍鞅理论,推导出一个上鞅作为最优适应度值的群进化序列;然后,运用上鞅收敛定理,并结合其Markov性质对GWO算法进行收敛性分析,证明GWO算法能以1的可能性达到全局收敛;最后,通过数值实验验证其收敛性能.实验结果表明,GWO算法具有全局收敛性强、计算耗时较低、寻优精度高等特点.
2022, 37(11):2849-2859. DOI: 10.13195/j.kzyjc.2021.0725
摘要:在解决超多目标优化问题中,基于分解的进化算法是一种较为有效的方法.传统的分解方法依赖于一组均匀分布的参考向量,它借助聚合函数将多目标优化问题分解为一组单目标子问题,然后对这些子问题同时进行优化.然而,由于参考向量分布和Pareto前沿形状的不一致性,导致这些预定义的参考向量在解决复杂超多目标优化问题时表现较差.对此,提出一种基于自适应增强学习的超多目标进化算法(MaOEA-ABL).该算法主要分为两个阶段:第1阶段,采用一种自适应增强学习算法对预定义的参考向量进行调整,在学习过程中删除无用向量,增加新的向量;第2阶段,设计一种对Pareto形状无偏好的分解方法.为验证所提出算法的有效性,选取具有复杂Pareto前沿的MaF系列测试函数进行仿真研究,结果显示,MaOEA-ABL算法的IGD(inverted generational distance)均值在67%的测试函数上超过了对比算法,从而表明该算法在复杂超多目标优化问题中表现良好.
2022, 37(11):2860-2868. DOI: 10.13195/j.kzyjc.2021.0513
摘要:针对标准正余弦算法进化后期的停滞问题,对进化过程中的种群多样性进行分析,得出标准正余弦算法的种群多样性受控制因子的直接影响,且种群多样性表达式中控制因子指数随迭代次数的增加而下降.为了改善标准正余弦算法进化后期的探索和开采,提出多尺度正余弦优化算法.该算法通过自适应的多尺度控制因子调节群体多样性从而实现多层次的搜索;同时设计协助种群实施局部搜索,其种群独立进化,个体可以直接学习主群或协助种群中的最优个体,以加快收敛速度和提高解的质量.将所提出算法与改进的正余弦算法和新型群智能算法进行对比实验,实验结果表明,所提出算法能够较好地平衡进化过程中的探索和开采,提高全局优化能力.
2022, 37(11):2869-2879. DOI: 10.13195/j.kzyjc.2021.0744
摘要:转炉炼钢终点控制的关键是实现碳温准确预测.针对炉次样本间波动性较大,导致即时学习的样本相似性度量困难而造成预测精度不高的问题,提出一种基于改进谱聚类算法构建的相似性度量策略.首先,根据过程变量和关键变量间的耦合关系构造全局加权KL度量准则的谱聚类算法,获得类间方差较大、类内方差较小的聚类子集以消除炉次样本间的波动;其次,根据类簇间差异信息,融入局部加权KL度量准则计算待测样本隶属于各类的后验概率,从而构造出一种适合描述转炉炼钢过程复杂特性的相似性度量策略;最后,采用该度量策略度量出与待测炉次工况特性更加相似的样本子集,建立相关向量机回归模型进行终点碳温预测.实际转炉炼钢生产过程数据仿真结果表明,碳含量在pm0.02%的预测误差范围内精度达到89%,温度在pm$10\textdegree$C的误差范围内精度达到92%.
2022, 37(11):2880-2886. DOI: 10.13195/j.kzyjc.2021.0561
摘要:针对边缘计算应用对实时性的要求,引入软件定义网络和网络功能虚拟化技术对边缘计算网络进行重构.基于此,考虑以最大化长期平均实时任务处理成功率为目标的计算和通信资源在线分配问题.通过建立马尔可夫决策过程模型,提出基于Q学习的资源在线分配方法.Q学习在状态动作空间较大时内存占用大且会发生维度灾难,鉴于此,进一步提出基于DQN的资源在线分配方法.实验结果表明,所提出算法能够较快收敛,且DQN算法相较于Q学习和其他基准方法能够获得更高的实时任务处理成功率.
2022, 37(11):2887-2896. DOI: 10.13195/j.kzyjc.2021.0495
摘要:针对拒绝服务(denial-of-service, DoS)攻击下一类二阶多智能体系统的安全分组一致性协同控制问题,区别于同类工作,在非周期性多信道独立的攻击场景下,基于复杂系统中智能体间的合作与竞争交互,提出一种新的带有状态估计器的安全分组一致性控制协议.在该协议的作用下,首先,给出DoS攻击持续时间的约束条件,通过设计合适的李雅普诺夫函数,结合求解代数黎卡提方程得到不同攻击模式下信道的衰减率;然后,通过引入与各个信道对应的等效衰减率,克服所得衰减率与信道难以匹配的问题,并给出系统的稳定性判据;最后,通过数值实验验证理论分析所得结论的正确性和有效性.
2022, 37(11):2897-2906. DOI: 10.13195/j.kzyjc.2021.0395
摘要:针对二阶有向多智能体系统的一致性问题,在连续时间域和离散时间域分别提出一种非光滑控制协议.首先,提出一种连续时间非光滑一致性协议,通过李雅普诺夫理论和齐次系统理论,证明在无扰动情况下可以实现智能体状态的有限时间一致,而在有扰动情况下智能体状态之间的误差将收敛到一个与控制参数和外部扰动相关的范围内;然后,基于采样控制,提出离散非光滑一致性协议,进一步分析采样周期对智能体状态之间误差的影响,并给出误差收敛区间与控制参数、外部扰动和采样周期关系的显性表达式;最后,通过仿真实例验证理论的正确性和有效性.
2022, 37(11):2907-2916. DOI: 10.13195/j.kzyjc.2021.0461
摘要:全桥逆变器是一类典型的开关型非线性系统,系统中存在很多非线性和不确定因素,易导致系统性能下降,甚至造成不稳定.对于具有未建模动态和时变输出约束的单相全桥逆变器系统,利用动态信号处理未建模动态,设计辅助动态系统补偿控制信号,提出一种事件触发的自适应动态面跟踪控制策略;引入跟踪误差变换,解决输出约束问题;对控制输入进行约束,使用模糊系统调节参数向量的欧氏范数作为自适应参数,设计事件触发控制,这些技术的采用可有效降低控制器计算量,保证实际系统的可实现性,完善了具有输入约束条件下动态面控制方法的稳定性分析和证明.逆变器精确模型无需已知,实际控制系统具有较好的稳定性和鲁棒性.理论分析表明,闭环系统的所有信号半全局一致终结有界,所提出方案的有效性通过仿真实验得到进一步验证.
2022, 37(11):2917-2924. DOI: 10.13195/j.kzyjc.2021.0658
摘要:针对霍尔传感器的未建模动态和滑模控制器的非线性,研究两者的共同作用对Buck变换器谐波性能的影响.基于变换器的数学模型和Lyapunov稳定性定理,给出传统滑模控制器参数的整定方法;在此基础上,利用描述函数法和奈奎斯特稳定性判据,分析常规忽略传感器作用下的系统稳定性.考虑霍尔传感器的测量性能,建立Buck变换器-传感器的联合数学模型,利用奈奎斯特稳定性判据推导出保证系统临界稳定的约束条件,从理论上证明霍尔传感器诱发谐波的必然性,并揭示了滑模控制器参数和传感器参数对系统谐波幅频性能的数学影响关系.仿真结果表明了所提出方法的正确性和有效性.
2022, 37(11):2925-2933. DOI: 10.13195/j.kzyjc.2021.0162
摘要:针对二阶线性多智能体系统的分群一致控制问题,考虑智能体通信拓扑同时包含协作和对抗关系,提出一种基于事件驱动控制的有限时间分布式领航跟随分群一致性算法,该算法可使多智能体系统在有限时间内实现分群一致,即各子组内的智能体实现状态一致,不同子组收敛至不同一致状态.采用事件驱动控制机制,设计事件驱动函数及事件触发条件,降低智能体控制器更新频率,减少系统能耗.基于代数图论和李雅普诺夫稳定性理论推导出系统的有限时间稳定性条件,通过巧妙构造Lyapunov函数,给出系统有限收敛时间的显式估计,同时证明在所提出的事件驱动机制下,每个智能体相邻触发时间间隔有严格的正下界,即避免了芝诺行为.仿真实验验证了所提出的有限时间事件驱动分群一致控制算法的有效性.
2022, 37(11):2934-2940. DOI: 10.13195/j.kzyjc.2021.0509
摘要:针对传感器网络下网络化运动控制系统的攻击重构问题,提出一种新的分布式投影中间估计器,以此估计传感器和执行器攻击信号.首先,引入投影算子确定受攻击的信道集,同时设计最小二乘算法减轻观测器在估计过程中的计算负担;然后,引入分布式估计框架以提高算法的可伸缩性和扩展性;最后,通过网络化运动控制系统的实验验证所提出方法的有效性.实验结果表明,所提出算法的估计精度和实时性分别优于现有的扩张状态观测器和梯度下降算法.
2022, 37(11):2941-2948. DOI: 10.13195/j.kzyjc.2021.0538
摘要:针对一类非线性系统同时存在执行器故障、传感器故障和扰动的问题,提出一种基于有限时间未知输入观测器的故障检测与估计方法.首先,通过线性非奇异变换将原系统解耦为两个降阶的子系统,其中一个子系统只包含扰动,另一个子系统同时包含扰动和故障;然后,通过一阶低通滤波器获得新的状态并与子系统构成增广系统,实现将原系统的传感器故障转化为增广系统的执行器故障;接着,设计未知输入观测器对增广系统故障进行检测,实现在有限时间内估计出系统的扰动和故障,并通过理论分析验证所设计观测器的有限时间收敛性;最后,基于永磁同步电机(PMSM)转速系统进行仿真研究,仿真结果验证了所提出方法的有效性.
2022, 37(11):2949-2958. DOI: 10.13195/j.kzyjc.2021.0622
摘要:图像情感分析是机器视觉领域的研究热点,它面临的关键问题是:标注者的主观差异导致情感标签明确的高质量样本匮乏,且异构图像特征间跨模态语义未有效利用.为此,提出基于主动样本精选与跨模态语义挖掘的图像情感分析模型ASRF2(active sample refinement & feature fusion):融合主动学习与样本精选思想,设计主动样本精选策略,优选情感标签明确的样本;对异构图像特征执行判别相关分析,生成能准确刻画图像情感内容的低维跨模态语义;采用跨模态语义训练Catboost模型,实现图像情感分析.在TwitterI与FI数据集上验证ASRF2模型,识别准确率分别达90.06%和75.77%,优于主流基线且实时效率良好.与基线相比,ASRF2模型仅需两类特征,参数调制简单,更易复现.ASR策略还具备一定的泛化性,可为基线模型提供优质训练样本,以改善识别性能.
2022, 37(11):2959-2967. DOI: 10.13195/j.kzyjc.2020.1367
摘要:针对含有有色噪声的非线性Hammerstein-Wiener模型,提出一种基于组合式信号源的辨识方法.通过利用可分离信号和随机信号组成的组合信号源实现有色噪声干扰下Hammerstein-Wiener模型各串联模块参数辨识的分离,简化辨识过程.首先,基于可分离信号的输入和输出,采用相关分析方法抑制过程噪声的干扰,辨识输出静态非线性模块和动态线性模块的参数;然后,基于辅助模型技术,利用辅助模型的输出和残差的估计值分别取代辨识模型中的不可测中间变量和噪声变量,推导辅助模型递推增广最小二乘方法,根据随机信号的输入输出数据辨识输入静态非线性模块和噪声模型的参数;最后,通过理论分析和仿真结果表明,所提出方法能够有效辨识有色噪声干扰下的非线性Hammerstein-Wiener模型,具有较好的鲁棒性.
2022, 37(11):2968-2976. DOI: 10.13195/j.kzyjc.2021.0624
摘要:在原有数据聚类结果的基础上,如何对新增数据进行归属度量分析是提高增量式聚类质量的关键,现有增量式聚类算法更多地是考虑新增数据的位置分布,忽略其邻域数据点的归属信息.在粗糙K-means聚类算法的基础上,针对边界区域新增数据点的不确定性信息处理,提出一种基于邻域归属信息的粗糙K-means增量式聚类算法.该算法综合考虑边界区域新增数据样本的位置分布及其邻域数据点的类簇归属信息,使得新增数据点与各类簇的归属度量更为合理;此外,在增量式聚类过程中,根据新增数据点所导致的类簇结构的变化,对类簇进行相应的合并或分裂操作,使类簇划分可以自适应调整.在人工数据集和UCI标准数据集上的对比实验结果验证了算法的有效性.
2022, 37(11):2977-2983. DOI: 10.13195/j.kzyjc.2021.0566
摘要:针对现有的多核学习(multiple kernel learning, MKL)子空间聚类方法忽略噪声和特征空间中数据的低秩结构问题,提出一种新的鲁棒多核子空间聚类方法(low-rank robust multiple kernel clustering, LRMKC),该方法结合块对角表示(block diagonal representation, BDR)与低秩共识核(low-rank consensus kernel, LRCK)学习,可以更好地挖掘数据的潜在结构.为了学习最优共识核,设计一种基于混合相关熵度量(mixture correntropy induced metric, MCIM)的自动加权策略,其不仅为每个核设置最优权重,而且通过抑制噪声提高模型的鲁棒性;为了探索特征空间数据的低秩结构,提出一种非凸低秩共识核学习方法;考虑到亲和度矩阵的块对角性质,对系数矩阵应用块对角约束.LRMKC将MKL、LRCK与BDR巧妙融合,以迭代提高各种方法的效率,最终形成一个处理非线性结构数据的全局优化方法.与最先进的MKL子空间聚类方法相比,通过在图像和文本数据集上的大量实验验证了LRMKC的优越性.
2022, 37(11):2984-2992. DOI: 10.13195/j.kzyjc.2021.0782
摘要:随着网络平台上各类图像、视频数据的快速增长,多模态情感分析与情绪识别已成为一个日益热门的研究领域.相比于单模态情感分析,多模态情感分析中的模态融合是一个亟待解决的关键问题.受到认知科学中情感唤起模型的启发,提出一种能够模拟人类处理多通道输入信息机制的深度情感唤醒网络(DEAN),该网络可实现多模态信息的有机融合,既能处理情绪的连贯性,又能避免融合机制的选择不当而带来的问题.DEAN网络主要由以下3部分组成:跨模态Transformer模块,用以模拟人类知觉分析系统的功能;多模态BiLSTM系统,用以模拟认知比较器;多模态门控模块,用以模拟情感唤起模型中的激活结构.在多模态情感分析与情绪识别的3个经典数据集上进行的比较实验结果表明,DEAN模型在各数据集上的性能均超越了目前最先进的情感分析模型.
2022, 37(11):2993-3002. DOI: 10.13195/j.kzyjc.2021.0648
摘要:图卷积网络由于能够直接处理关节点拓扑图在行为识别方面表现出较好的性能而备受关注,但是这类方法中经常存在长时信息依赖建模能力较弱以及未关注空间语义与时间事件变化不均衡问题,对此,提出基于时域扩张残差网络和双分支结构的人体行为识别方法.在时空行为特征提取方法中,不仅用图卷积提取空间域特征,而且用扩张因果卷积和残差连接结构来构建时域扩张残差网络以提取时域特征,该网络能够在未大量增加参数的基础上有效扩大在时域上的感受野,从而更好地获得在时域上的人体关节信息的长时依赖关系.同时构建双分支结构,其中低帧率分支以较少的时间帧数和较多的通道数侧重于提取丰富的空间语义信息,高帧率分支以较多的时间帧数和较少的通道数在保证网络轻量级的前提下有效捕捉人体行为的快速变化.实验结果表明,所提出方法在NTU RGB$ + $D数据集上的准确率高于目前先进的行为识别方法.
2022, 37(11):3003-3011. DOI: 10.13195/j.kzyjc.2021.0470
摘要:随着自动驾驶技术的迅速发展,车辆日益增长的处理需求与资源受限的车载处理器之间的矛盾日渐突出.车载边缘计算的出现解决了车载资源的物理限制,增强了单个车辆的计算能力.然而,由于车载服务通常具有时延敏感性,如何选择合适的通信接入技术,更好地满足自动驾驶场景中时延要求便成为一个挑战性难题.鉴于此,综合考虑两种V2X通信接入技术,即短距通信(DSRC)和基于蜂窝网的车载通信(C-V2X),提出一种V2X异构车载网络任务卸载模型.首先分析车辆移动性特征,并对车载资源进行虚拟化处理;然后基于半马尔科夫决策过程原理对任务卸载问题进行建模,分别制定状态、动作、奖励和转移概率;最后基于强化学习智能算法获取最优任务卸载策略,并通过大量数值仿真实验验证其任务卸载性能优于贪婪算法.
2022, 37(11):3012-3022. DOI: 10.13195/j.kzyjc.2021.0703
摘要:针对区域港口群内陆公共腹地的空箱供需状况,构建多港口、多周期空箱存储与调运联合优化混合整数规划模型,利用马尔科夫决策过程与动态规划相结合的方法,在(D,U)库存控制策略下对港口群内各港口的空箱库存保有量区间进行动态优化,以此为基础对港口群公共腹地和各港口间的空箱调运方案进行优化,并以辽宁沿海港口群-----东北腹地为对象进行实证分析.实验结果表明,(D,U)控制策略下的空箱调运能够为船公司节省15.22%的总成本.选取公共腹地数量、公共腹地和港口空箱需求量、单位租箱成本以及单位库存成本进行灵敏度分析,进而验证(D,U)控制策略能够削弱船公司在外界环境发生变化时受到的影响.
2022, 37(11):3023-3032. DOI: 10.13195/j.kzyjc.2021.0635
摘要:针对现实中存在的带有协商交互的在线多源多属性反向拍卖(OMSMARA)情形,同时考虑到买卖(采供)双方面临的不同方面的不确定性,综合利用双层规划理论和模糊理论研究不确定情形下OMSMARA双边协商决策问题.首先,基于问题描述和适当假设,建立一个新的带有协商交互的模糊混合整数双层规划(FMIBLP)模型,并基于增广模糊最小最大决策方法进行模型的精确转化;其次,考虑到问题模型的特点以及粒子群算法(PSO)的优越性,提出基于修正PSO的双层分布迭代算法(PSO-BLDI)用于模型求解;然后,通过数值算例和对比分析展示所建模型的可行性以及所提出算法的有效性;最后,通过敏感性分析研究相关参数变化对模型求解结果的影响,进一步表明所提出模型的合理性与决策方法的有效性.
2022, 37(11):3033-3041. DOI: 10.13195/j.kzyjc.2021.0753
摘要:针对现有面板数据关联分析模型中指标的排列顺序变换引起灰色关联序不一致以及面板数据三角曲面构造的不足,提出一种基于面板数据的灰色四面体网格关联分析模型.首先,基于数列的组合原理将样本矩阵分解为二元指标子矩阵;其次,将二元指标子矩阵投射为空间四面体网格,并给出四面体的有向体积;然后,基于有向体积构造二元指标的关联系数,最终得到灰色四面体网格关联分析模型,并对模型的对称性、规范性、平移不变性等性质进行证明;最后,将模型应用到山东省沿海城市的空气质量评价,验证模型的合理性和有效性,并分析了灰色四面体网格关联分析模型不受指标排列顺序变化的影响.
2022, 37(11):3042-3051. DOI: 10.13195/j.kzyjc.2021.0426
摘要:针对以最小化总延迟时间为优化目标的分布式置换流水线问题(distributed permutation flowshop scheduling problem,DPFSP),建立问题排序模型,并提出混合迭代贪婪算法(hybrid iterated greedy,HIG)进行求解.基于问题特点提出最小工期差值(smallest due date difference value,SDV)规则及3种工厂分配规则, 同时结合问题性质提出两种工件插入各工厂内部时问题目标值的下界估计方法.首先,通过实验确定使用分配规则1将工件向各工厂进行分配,同时结合下界估计方法的NEH作为改进启发式算法以生成较高质量初始解;其次,为了增加解的多样性,提出一种关键工厂的移除策略和适用于问题的模拟退火机制;然后,设计基于4种有效邻域操作的两阶段变邻域下降搜索策略,用于在HIG每代中对问题解空间的不同区域进行较深入和细致的搜索;最后,通过仿真实验和算法比较验证了采用HIG求解所提出问题的有效性.
2022, 37(11):3052-3057. DOI: 10.13195/j.kzyjc.2021.0448
摘要:在节点性能有限的边缘计算环境下进行分布式入侵检测系统(distributed intrusion detection system,DIDS)的任务分配,是一种典型的资源受限任务调度问题.针对该问题,提出基于深度强化学习的DIDS低负载任务调度方案.该方案将任务调度过程描述为马尔科夫决策过程(Markov decision process,MDP)并建立模型的相关空间和价值函数,找到保持DIDS低负载状态的最优策略.针对状态和动作空间过大且高维连续的问题,提出通过深度循环神经网络进行函数拟合.实验表明,所提出方案可使DIDS在网络变化中动态调节调度策略,保持系统整体的低负载,而安全指标没有明显降低.
2022, 37(11):3058-3064. DOI: 10.13195/j.kzyjc.2021.0783
摘要:传统无偏灰色预测模型的参数估计和序列模拟都是通过白化方程的离散时间响应函数求取相应的估计值和模拟值.基于精细积分法,提出一种无需求离散时间响应函数的无偏非齐次灰色模型.该模型通过引入新变量,将白化方程转化为齐次矩阵微分方程,利用指数矩阵求得递推关系,进而推导参数无偏估计公式,并采用精细积分法直接计算灰色模型的模拟(预测)值,从而减少舍入误差,提高计算精度.同时,还证明该建模方法具有非齐次指数规律重合性和伸缩变换一致性.严格非齐次指数序列、近似非齐次指数序列、不同类型的单调序列以及汽车保有量预测实例的结果进一步表明,所构建的模型能严格拟合非齐次指数序列,验证了该模型的有效性和实用性,提高了拟合(预测)精度.
2022, 37(11):3065-3072. DOI: 10.13195/j.kzyjc.2021.0707
摘要:针对全向移动机器人在跟踪目标的过程中存在跟踪误差以及产生能量损耗的问题,首先构建一种新型机器人能耗模型,该模型能够有效预测机器人运行过程中各种能量消耗;其次,基于该能耗模型设置兼顾轨迹跟踪误差和能耗最小的性能指标函数,在其约束下,提出一种基于干扰鲁棒补偿的反馈节能控制器;然后,引入不确定性及干扰估计观测法,构建鲁棒补偿项,在满足能耗最优的前提下实现对外界干扰的有效抑制;最后,基于Lyapunov稳定性理论证明所提出的节能干扰鲁棒补偿控制系统是渐近稳定的.通过将所提出的控制器与比例微分控制器、$H_\infty$控制以及节能补偿控制进行比较,仿真结果表明,所提出的控制方法其控制精度更高、能量损耗更低、具有更强的鲁棒性.
办公地点:东北大学 综合楼313室
通讯地址:沈阳市和平区文化路3巷11号 东北大学125信箱 《控制与决策》编辑部(110819)
收件人:《控制与决策》编辑部 (如果快递,请选择EMS或顺丰快递,其他快递无法送达。)
电话: 024-83687766,23906437
版权所有 :控制与决策
技术支持:北京勤云科技发展有限公司
E-mail: kzyjc@mail.neu.edu.cn
版权所有 :控制与决策
技术支持:北京勤云科技发展有限公司