2024, 39(5):1409-1423. DOI: 10.13195/j.kzyjc.2023.0631
摘要:机器人的应用场景正在不断更新换代,数据量也在日益增长.传统的机器学习方法难以适应动态的环境,而增量学习技术能够模拟人类的学习过程,使机器人能利用旧知识来加快新任务的学习,在不遗忘旧技能的前提下学习新的技能.目前对于机器人增量学习的相关研究仍然较少,对此,主要介绍机器人增量学习研究进展.首先,对增量学习进行简介;其次,从参数和模型的角度出发,将当前机器人增量学习主流方法分为变参数方法、变模型方法、混合方法3类,分别对每一类进行论述,并给出相应的增量学习技术在机器人领域中的应用实例;然后,对机器人增量学习中常用的数据集和评价指标进行介绍;最后,对增量学习未来的发展趋势进行展望.
2024, 39(5):1424-1432. DOI: 10.13195/j.kzyjc.2023.0834
摘要:由于传统人驾车(traditional human-driven vehicles,HVs)驾驶行为会受到驾驶员的心理和生理活动的不确定性影响,可能使得车辆频繁地加减速,进而导致混合交通条件下网联自动车(connected and automated vehicles,CAVs)很难快速跟踪此行为.针对这一问题,首先提出一种提前预测传统人驾车行为的组合神经网络.在此基础上,考虑通信时延和车辆运动学特性,设计一种基于交通信息物理系统(transportation-cyber physical system,T-CPS)的混行车群内车辆协同控制策略,使其能够快速跟踪上传统人驾车行为,并对混行车群内网联自动车之间的串稳定性进行分析.最后,在混合交通条件下设置由1辆传统人驾车、1辆领头网联自动车和4辆跟随网联自动车形成的混行车群,利用下一代交通仿真(next generation simulation,NGSIM)车辆轨迹数据选出高质量传统人驾车状态,并通过仿真实验验证所提协同控制策略的有效性和可行性.由仿真实验结果可知,所提协同控制策略可以保证所有的网联自动车能够快速跟踪上传统人驾车行为,为解决新型混合交通带来的新问题提供一定的理论指导和借鉴.
2024, 39(5):1433-1440. DOI: 10.13195/j.kzyjc.2022.0811
摘要:针对挖掘机的自主作业场景,提出基于强化学习的时间最优轨迹规划方法.首先,搭建仿真环境用于产生数据,以动臂、斗杆和铲斗关节的角度、角速度为状态观测变量,以各关节的角加速度值为动作信息,通过状态观测信息实现仿真环境与自主学习算法的交互;然后,设计以动臂、斗杆和铲斗关节运动是否超出允许范围、完成任务 总时间和目标相对距离为奖励函数对策略网络参数进行训练;最后,利用改进的近端策略优化算法(proximal policy optimization, PPO)实现挖掘机的时间最优轨迹规划.与此同时,与不同连续动作空间的强化学习算法进行对比,实验结果表明:所提出优化算法效率更高,收敛速度更快,作业轨迹更平滑,可有效避免各关节受到较大冲击,有助于挖掘机高效、平稳地作业.
2024, 39(5):1441-1449. DOI: 10.13195/j.kzyjc.2022.1402
摘要:针对行人重识别中可用行人图像不足导致的小样本问题,以双相似网络为基础,提出一种基于多尺度混合注意力与度量融合的小样本行人重识别方法.首先,将多尺度混合注意力机制引入特征嵌入模块,即在不同尺度层内的特征提取中引入空间注意力,在不同尺度层间的特征融合中引入通道注意力,实现更具判别力的小样本行人特征提取;然后,在度量模块,提出欧氏距离与余弦距离融合的双重度量方法,实现行人特征的空间绝对距离和方向差异的综合度量,提升行人相似性度量的可靠性;接着,采用双重度量方式和关系度量方式,分别获得行人特征的相似度得分;最后,通过加权融合获得联合度量得分,构建联合损失实现网络的整体优化和训练.在Market-mini、Duke-mini和MSMT17-mini三个小型数据集上的实验表明,所提出方法在5-way 1-shot和5-way 5-shot两种模式下的平均识别准确率分别达到90.40%和95.69%、86.77%和94.96%、71.08%和82.63%,与其他小样本学习算法相比,识别性能有较大提升.
2024, 39(5):1450-1460. DOI: 10.13195/j.kzyjc.2022.1699
摘要:近年来随着深度学习技术的不断发展,涌现出各种基于深度学习的语义分割算法,然而绝大部分分割算法都无法实现推理速度和语义分割精度的兼得.针对此问题,提出一种多通道深度加权聚合网络(MCDWA_Net)的实时语义分割框架.\:该方法首先引入多通道思想,构建一种3通道语义表征模型,3通道结构分别用于提取图像的3类互补语义信息:低级语义通道输出图像中物体的边缘、颜色、结构等局部特征;辅助语义通道提取介于低级语义和高级语义的过渡信息,并实现对高级语义通道的多层反馈;高级语义通道获取图像中上下文逻辑关系及类别语义信息.\:之后,设计一种3类语义特征加权聚合模块,用于输出更完整的全局语义描述.\:最后,引入一种增强训练机制,实现训练阶段的特征增强,进而改善训练速度.\:实验结果表明,所提出方法在复杂场景中进行语义分割不仅有较快的推理速度,且有很高的分割精度,能够实现语义分割速度与精度的均衡.
2024, 39(5):1461-1468. DOI: 10.13195/j.kzyjc.2022.1714
摘要:哺乳动物的运动学习机制已得到广泛研究,犬科动物可以根据环境反馈的引导性信息自主地学习运动技能,对其提供更为特定的训练引导可以加快其对相关任务的学习速度.受上述启发,在软演员-评论家算法(SAC)的基础上提出一种基于期望状态奖励引导的强化学习算法(DSG-SAC),利用环境中的状态反馈机制来引导四足机器人进行有效探索,可以提高四足机器人仿生步态学习效果,并提高训练效率.在该算法中,策略网络与评价网络先近似拟合期望状态观测与当前状态的误差,再经过当前状态的正反馈后输出评价函数与动作,使四足机器人朝着期望的方向动作.将所提出算法在四足机器人上进行验证,通过实验结果可知,所提出的算法能够完成四足机器人的仿生步态学习.进一步,设计消融实验来探讨超参数温度系数和折扣因子对算法的影响,实验结果表明,改进后的算法具有比单纯的SAC算法更加优越的性能.
2024, 39(5):1469-1477. DOI: 10.13195/j.kzyjc.2022.1835
摘要:为了实现强噪声和模糊干扰下的低清人脸图像重建,提出一种基于多级隐空间信息约束的噪声人脸超分辨率算法.首先设计一个用于人脸有效信息提取的特征蒸馏网络, 并通过统计性抗干扰模型和隐空间特征对比算法移除噪声等无效信息,构建一个具有高噪声鲁棒性的人脸信息提取模型;然后,设计人脸重建网络,该网络利用提取的人脸特征重建高清人脸图像; 最后,通过人脸身份嵌入模型和离散小波变换模型,分别从超球面身份度量空间和小波域进一步对重建人脸的身份信息和空间结构进行约束.实验结果表明,所提出的算法不仅能够有效去除高噪声环境下的人脸噪声,而且还能有效提升人脸图像分辨率,获得更高的峰值信噪比(peak signal-to-noise ratio,PSNR)和结构相似度(structural similarity index,SSIM),具有较好的实用性.
2024, 39(5):1478-1486. DOI: 10.13195/j.kzyjc.2022.1653
摘要:针对传统多目标回归算法无法处理输入与多输出间的非线性关系,且忽视了数据点在输入与输出之间的结构信息,导致算法泛化性能受限、缺乏稳健性等问题,提出一种基于实例与目标相关性的多目标稀疏回归(multi-target sparse regression with instances and targets correlations,MTR-ITC)算法.首先,通过嵌入潜变量空间来对复杂的输入与输出以及输出间的关联结构解耦,并利用核技巧和稀疏回归学习输入输出间的非线性关系和输出间的相关结构;然后,引入流形正则化项探索不同实例在输入与输出变量间的相关性,确保模型输出与真实结果在局部和全局结构的一致性,以提升模型泛化性能;最后,提出一种交替优化算法来对目标函数进行求解,使其能快速收敛至全局最优.在基准测试数据集上的实验表明,所提算法在不同MTR数据集上均具有较好的测试性能.
2024, 39(5):1487-1497. DOI: 10.13195/j.kzyjc.2022.0964
摘要:基于模块化多电平换流器(modular multilevel converter,MMC)的统一电能质量调节器(unified power quality conditioner,UPQC)在电网电压不平衡时,采用传统控制方法存在补偿效率和精确性较低的问题.针对这一情况,提出一种无源超螺旋二阶滑模控制策略.首先,基于MMC-UPQC的数学模型和无源控制理论,设计不平衡电网电压下基于欧拉-拉格朗日模型的正负序无源控制器;然后,加入超螺旋二阶滑模控制对无源控制器进行改善,抑制常规滑模存在的抖振,并解决无源控制对系统精度要求高的问题,提高系统的响应速度、补偿精度和抗干扰能力,提升系统的整体性能;最后,在Matlab/Simulink平台上进行仿真,并与PI控制和单独的无源控制对比,仿真结果验证了所提无源超螺旋二阶滑模控制策略的有效性和优越性.
2024, 39(5):1498-1506. DOI: 10.13195/j.kzyjc.2022.1740
摘要:针对一类严格反馈非线性系统,提出一种基于有限时间指令滤波的自适应固定时间预设性能控制策略.首先,引用非线性映射技术及适当的误差变换,建立等效的误差模型;其次,综合利用反步法、固定时间控制和自适应控制等方法,设计一种基于有限时间指令滤波的预设性能跟踪控制器.该策略应用指令滤波器解决了反步法中对虚拟控制律反复求导问题,减轻了计算负担.此外,预设性能控制和固定时间控制保证了系统的跟踪误差能够在固定时间内收敛到预设性能函数限定的范围内,其收敛时间与系统初始条件无关,且确保系统中全部信号在有限时间均达到有界区域.理论分析与仿真验证均表明了所提出设计方法的有效性.
2024, 39(5):1507-1516. DOI: 10.13195/j.kzyjc.2022.2028
摘要:针对水流冲击引起无人船(unmanned surface vehicle,USV)转艏呈现非线性特点,建立基于转艏运动的非线性变参数(nonlinear parameter-varying,NPV)USV模型,并提出一种NPV $H_\infty$ 艏向控制方法,以提高艏向调节的快速性和鲁棒性.首先,考虑低展弦比机翼理论能较好地描述船体受水流冲击的特点,建立基于水动力阻尼的非线性Fossen模型.通过忽略横荡速度和横流阻力将动力学模型简化为操纵动力学模型,并引入艏向角,建立NPV艏向模型.其次,构造与艏向控制系统状态和纵荡速度变参相关的Lyapunov函数,推导出满足艏向闭环控制系统$H_\infty$鲁棒稳定的非线性控制器求解条件,该条件是一个非线性矩阵不等式(nonlinear matrix inequality,NLMI).由于NLMI难以求解,根据平方和(sums of squares,SOS)理论,用多项式矩阵代替NLMI中的非线性矩阵,并将NLMI 转化为可使用SOS工具求解的多项式线性矩阵不等式.仿真结果表明,NPV $H_\infty$控制器在艏向调节时具有较快的系统响应和更高的准确性.
2024, 39(5):1517-1526. DOI: 10.13195/j.kzyjc.2022.1688
摘要:研究符号图下具有扰动的多智能体系统二分一致性控制问题.考虑了线性系统、非线性不确定系统以及切换拓扑的情况,分别提出相应的预定时间控制器,各控制器可使系统在预定时间内实现二分一致性.通过Lyapunov稳定性理论、代数图论和矩阵分析等验证算法的准确性;仿真对比实验验证了所提算法的可行性和有效性;相较于有限时间控制算法,所提算法的收敛时间不依赖于初始状态,可以通过选择单一时间参数设定系统收敛时间上界;相较于固定时间控制算法,所提算法预设收敛时间与控制算法参数无关,设定简单,具有更低的保守性.
2024, 39(5):1527-1536. DOI: 10.13195/j.kzyjc.2022.1603
摘要:建立市场化的政企联合储备模式已经成为应急物资储备体系建设的重要方式.基于此,着眼于应急物资采购及代储服务的交易问题,设计一个逆向组合拍卖机制.在此拍卖机制中,政府是拍卖的买方兼委托人,企业是拍卖的卖方兼竞拍者,应急物资采购及代储服务是拍卖商品.首先,通过一个报童模型建立政府决策行为与拍卖活动之间的关系,并提出企业的投标策略;其次,建立最小化供需偏差和最大化供给数量的竞胜标决定模型;最后,提出一个符合实际背景的数值算例对拍卖机制进行模拟和验证.研究表明,所提出的逆向组合拍卖机制不仅具有经济效率,还能够促进政府一次性达成与多家企业在多个周期的合作.由此可见,运用拍卖机制解决应急物资政企联合储备的交易问题具备理论的优越性和现实的适用性.
2024, 39(5):1537-1542. DOI: 10.13195/j.kzyjc.2022.1313
摘要:控制攻击时间和角度的协同制导律可提高多弹突防能力,发挥最大打击效能,是当前的研究热点.已有的协同制导律多数假设导弹飞行速度不发生改变,未考虑速度变化对到达时间估计带来的影响.鉴于此,采用贝塞尔曲线作为打击轨迹,根据导弹速度包络和贝塞尔轨迹长度对导弹到达时间进行估计.在证明贝塞尔曲线长度随初始航迹角增加而单调增加的基础上,通过调整虚拟初始航迹角来增加或缩短预期到达时间,进而实现弹群预期到达时间趋于一致.在假设缩短轨迹长度可缩短到达时间的基础上,证明了该协同算法可在飞行过程中控制弹群形成一致到达时间.通过仿真实验,验证了所提出算法可在保证各弹攻击角度精确的前提下实现较高的时间协同精度.
2024, 39(5):1543-1549. DOI: 10.13195/j.kzyjc.2022.1642
摘要:针对一类具有外部扰动的航天器控制系统,提出一种基于漏斗策略的高精度姿态控制方法,从而对整个跟踪控制轨迹进行规划,保证控制误差时刻满足设计需求,有效提升控制系统动态性能与品质.首先,对所提出姿态控制策略的跟踪性能进行理论分析,结果表明如果姿态控制误差初值位于根据性能需求设计的漏斗区域内,则在后续任意时刻跟踪误差将始终位于该动态性能漏斗中.在此基础上,考虑到实际工程应用中航天器系统控制信号的有界性需求,给出性能漏斗的优化设计方法,从而保证在输入幅值约束下控制系统的动态性能.最后通过数值仿真验证了所提出航天器姿态漏斗控制策略设计方法及理论分析结果的正确性和有效性.
2024, 39(5):1550-1556. DOI: 10.13195/j.kzyjc.2022.1111
摘要:辊道窑烧结过程是电池正极材料制备工艺的关键,烧结温度的精准控制对提高材料性能、保证产品一致性至关重要.然而,烧结过程通常面临动态信息难以获取、不同温区温度耦合严重以及存在外界干扰等问题,给精准控制辊道窑温度带来了很大的困难.鉴于此,提出一种新的辊道窑温度分散H∞控制方法.首先,构造一个有界函数来描述温度关联项对当前温区控制性能的最大影响,并根据该有界函数建立温区的极小化极大问题,可将辊道窑温度控制问题转化为更小规模的温区温度控制问题,通过求解所有温区的极小化极大问题的鞍点解得到辊道窑温度H∞控制策略,实现分散控制;然后,采用一种脱策Q学习算法学习各温区极小化极大问题的鞍点解,获得辊道窑关联系统的温度分散H∞控制器;最后,基于实际窑炉温度数据进行仿真实验,实验结果表明在干扰存在的情况下,所设计控制器仍然能够精准控制辊道窑温度稳定在设定值上.
2024, 39(5):1557-1565. DOI: 10.13195/j.kzyjc.2022.1822
摘要:针对风电介入下的多区域互联电力系统,提出一种分布式经济模型预测负荷频率控制策略.通过将大规模互联电力系统分解成若干个动态耦合的子系统,这些子系统能够利用网络交流并共享信息,使得各区域的控制器实现各自优化问题的求解.同时,在满足状态约束和控制输入约束的前提下,遵循传统火力发电优先、风力发电配合的原则,通过在线求解优化问题,实现风电介入下的多区域互联电力系统的负荷频率控制.为了提高系统整体运行经济性,所提出的分布式经济模型预测控制器将负荷调频成本、燃料消耗成本以及风力发电成本等经济性指标考虑在内.仿真结果表明,在阶跃负荷扰动下,所设计的控制器不仅可以满足调频要求,在降低计算负担和提高经济性能方面也具有一定优势.
2024, 39(5):1566-1576. DOI: 10.13195/j.kzyjc.2022.1388
摘要:为了及时有效地诊断风机齿轮箱早期微弱故障,针对齿轮箱微弱故障信号非线性、非平稳、低幅值、低信噪比的特点,提出一种基于多维特征评价的风机齿轮箱早期故障诊断方法.首先,利用变分模态分解将原始振动信号分解为多个固有模态分量,并构建“信息熵-峭度-包络谱峭度”多维特征评价模型,结合熵权法筛选关键特征分量以重构信号;其次,运用改进的小波阈值法降低噪声干扰对重构信号的影响,得到显著的故障冲击特征;再者,使用宽度学习系统进行状态识别,并利用$L_{21
2024, 39(5):1577-1586. DOI: 10.13195/j.kzyjc.2022.1401
摘要:针对具有多变量、非线性和高维度特点的间歇过程数据使得早期故障信号易被噪声干扰且故障幅值低导致故障监测效果不佳的问题,提出一种基于堆叠鲁棒邻域保持自编码(stack-robust neighborhood preserving autoencoder,S-RNPAE)的间歇过程早期故障监测方法.首先,通过$L_{2,1
2024, 39(5):1587-1594. DOI: 10.13195/j.kzyjc.2022.1325
摘要:设计一套基于状态切换的杂草测绘无人机集群级联失效控制算法.首先,分析农业测绘无人机集群的作业场景特征,并基于此将杂草测绘无人机集群的单机节点状态划分为初级态、中级态和高级态3种类型;然后,结合复杂网络基本原理提出一套基于单机节点状态切换和最小负载原则的失效控制算法;最后,通过数值算例和综合对比分析验证所提出算法的有效性和最佳使用条件.可以发现,不同失效过程对集群保持结构稳定和功能稳定的影响程度不同:中级态节点初始失效时网络的受影响程度最大;高级态节点初始失效时失效控制算法的效果最为显著;单机测绘半径和集群含有的低级态单机数目是影响集群测绘面积的两个因素,二者与集群测绘面积呈正相关,且前者对于监控面积的提升效果更加显著.
2024, 39(5):1595-1603. DOI: 10.13195/j.kzyjc.2022.1560
摘要:针对由智能制造现场动态生产过程的复杂随机因素影响造成的高噪声和质量异常监控方法效率低等问题,将变分模态分解方法(variational mode decomposition,VMD)与深度卷积神经网络(convolutional neural network,CNN)相结合,提出一种基于VMD-CNN的实时质量监控新方法.首先,利用VMD方法,将高噪声动态过程原始数据分解为包含质量异常特征和噪声信息的两类本征模态函数,通过去除噪声数据的本征模态函数,消除动态生产过程的高噪声干扰;进而,采用灰度变换将保留原始质量异常特征的本征模型函数转化为质量异常图像,构建VMD-CNN模型对质量异常图像进行识别,并提出基于VMD-CNN的高噪声动态过程质量异常实时监控框架;最后,通过实验验证所提方法的有效性,并与小波去噪方法和CNN识别模型进行对比分析,实验结果显示所提方法的识别精确度显著优于现有的动态过程质量异常监控方法.
2024, 39(5):1604-1611. DOI: 10.13195/j.kzyjc.2022.1818
摘要:卡尔曼滤波器广泛用于解决线性高斯系统的状态估计问题.然而,在实际应用中过程噪声和系统模型参数先验信息未知,且量测受到异常值干扰,给准确估计系统状态带来极大困难.针对具有噪声信息和状态模型不确定的动态系统,提出一种广义交互式多模型自适应滤波算法.该算法设计多个模型并行的方式对系统不确定进行处理,对于每个模型,建立Skew-T分布非对称重尾噪声表示模型,为了解决过程噪声与系统协方差相互耦合难以求解的问题,利用逆威沙特分布对系统预测协方差矩阵进行描述,并通过变分贝叶斯推理递归计算系统状态的后验分布.仿真结果和实验验证表明,在噪声信息和状态模型不确定条件下,所提出算法具有较高的估计精度.
2024, 39(5):1612-1619. DOI: 10.13195/j.kzyjc.2022.1717
摘要:大尺度遥感图像分割对单机处理方式而言是巨大挑战.Spark平台为在单机上构建用于大数据处理的分布式计算环境提供了可能.当Spark平台内置的K-means算法用于数字图像处理时,其中的Spark Shuffle弹性分布式数据集(RDD)分区一般采用缺省设置,尽管这种RDD设置简单便捷,但对大尺度图像分割任务容易造成“多分区、小数据”现象,极大影响图像分割速度.为此,采用覆盖部分上海市区的WorldView-3遥感图像为测试数据,在K-means算法初始化聚类中心阶段自定义影响RDD分区的参数spark.sql.shuffle.partitions,在迭代计算阶段调用coalesce()算子减少分区数;与串行K-means算法对比验证单机处理大数据的可行性与有效性,与优化前的Spark并行K-means算法对比实现了大尺度遥感图像快速分割.实验结果表明,在K-means算法初始化聚类中心和迭代计算阶段,将RDD分区数设置在CPU核数的1sim10倍,总用时由优化前的145s缩减到97s,尤其在初始化聚类中心阶段的时间效率上,优化后是优化前的500sim1000倍.
2024, 39(5):1620-1628. DOI: 10.13195/j.kzyjc.2022.1541
摘要:资源受限项目调度问题(RCPSP)是最具代表性的项目调度问题之一,针对实际情况中考虑资源投入的必要性,建立一种以资源投入为变量的基于广义资源日历约束的项目调度优化模型.首先,引入组合优先关系的概念对广义资源日历的概念和具体内容进行整合和完善,为了避免传统网络图在表示组合优先关系时出现的网络循环等弊端,使用节点表示活动开始和结束的瞬时状态改进节点网络图;其次,考虑活动优先关系、活动持续时间、不可更新资源总量和资源日历约束,以项目工期最短和项目成本最小为优化目标,运用CP优化器求解所建立的多目标优化模型;最后,通过设计仿真算例并进行数值实验验证模型的准确性和高效性.
2024, 39(5):1629-1635. DOI: 10.13195/j.kzyjc.2022.0989
摘要:航空发动机装配是航空发动机制造过程的关键环节,其工序多,流程复杂,生产过程中扰动频发,如装配时间波动、不合格返工等.针对不确定环境下的航空发动机装配线的调度问题,提出一种基于门控循环神经网络(GRU)的适应性调度方法.该调度方法包含扰动识别和调度规则调整两个部分:扰动识别模块以滑动时间窗口为周期,利用GRU神经网络进行渐近型扰动的识别;调度规则调整模块以扰动识别的结果为触发,通过构建基于GRU神经网络的调度规则决策模型,输出适配当前生产状态的新的调度规则,用以指导生成更新的调度方案.最后,以某航空发动机装配线为研究案例,对所提出适应性调度方法进行验证分析.对比实验结果表明,所提出方法能够有效提升装配线的设备利用率、日均生产率等性能.
2024, 39(5):1636-1644. DOI: 10.13195/j.kzyjc.2022.1615
摘要:针对实际生产中广泛存在的一类带恶化效应的同构并行机调度问题,以最小化最大完工时间为优化目标,构建该问题的整数规划模型,并提出一种启发式列生成算法(HCGA)进行求解.在HCGA中,首先,利用Dantzig-Wolfe分解方法,将原问题分解为一个主问题(MP)和多个子问题;然后,设计启发式算法获得初始列,其中每列为一台机器上的一个调度方案,基于初始列构建限制主问题(RMP)模型;接着,设计快速有效的动态规划算法求解子问题,以得到需添加至RMP的列集,同时,考虑传统列生成算法收敛速度较慢,设计一系列方法来加速列生成过程;最后,基于所获取的MP线性松弛解,设计深潜启发式算法确定原问题的整数解.HCGA与商用求解器GUROBI的对比实验结果表明,HCGA可在较短时间内获得更优的解.
2024, 39(5):1645-1653. DOI: 10.13195/j.kzyjc.2022.1726
摘要:研究在解决复杂系统决策问题时,群组的知识分布与群体结构两种关键特征对群体智能涌现的效果,即群组绩效的影响.提出基于群组合作网络的结构特征测度和基于决策要素的知识分布测度,群组结构主要包括链接强度以及网络的层次化或扁平化程度;知识分布根据知识的深度或广度衡量群组成员的构成类型:专才型群组、通才型群组以及混合型群组.采用基于适应度景观理论的连续时间马尔科夫链模拟群组解决复杂决策问题的能力.群组成员在自我利益(即对个体适应度提升的追求)和社会影响(即寻求与周围个体意见一致以达成共识)两种驱动因素下改变观点.研究表明:不平衡的知识分布会削弱群组绩效;群体结构会调节知识分布的影响作用;通才型群组在解决更加复杂问题时的表现明显优于专才型群组以及混合型群组;群组不应过分追求意见的一致性.
2024, 39(5):1654-1664. DOI: 10.13195/j.kzyjc.2022.2030
摘要:在碳交易政策背景下,以投资碳减排技术的制造商和投资区块链技术的零售商组成的供应链为研究对象,建立基于技术投资的集中决策模型、分散决策模型和纵向合作决策模型,运用微分博弈的方法研究供应链的技术投资决策与纵向合作策略问题,并设计双向成本分担契约来协调供应链.研究结果表明:只有当零售商的边际利润满足一定条件时,零售商才会选择与制造商纵向合作,且碳交易政策的存在会使纵向合作的条件变得更加严格;纵向合作能够实现供应链“减排增效”的双重红利;当碳交易价格高于某一阈值时,消费者绿色偏好和绿色信息敏感度的增加会降低供应链成员的技术投资水平;在一定条件下,双向成本分担契约能够完全协调供应链.
2024, 39(5):1665-1674. DOI: 10.13195/j.kzyjc.2023.0615
摘要:区块链技术能够有效缓解线上销售导致的消费者对绿色产品的质疑,而不同销售模式会影响制造商的区块链应用决策.基于此,分别在转销和代销模式下,构建制造商未应用/应用区块链的4种电商供应链决策模型,分析消费者质疑下的制造商销售模式选择及区块链应用策略,以及区块链应用对环境及社会福利的影响.研究发现,电商平台拓展市场能力及消费者环保意识的增强,均有利于减弱因消费者质疑以及区块链应用成本增加导致的消极影响.制造商与电商平台仅在佣金率适中时同时倾向代销模式,且消费者质疑与区块链应用成本的增加均会使得双方共同偏好代销模式的可能性变小.只有当区块链应用成本较小或消费者质疑程度较高时,制造商与电商平台才能从区块链应用中获益,并且转销模式下双方获益的阈值区间始终更大.即使制造商应用区块链能够提高产品绿色设计水平及其利润,也不一定能起到减弱产品环境总影响以及增加社会福利的作用.
2024, 39(5):1675-1686. DOI: 10.13195/j.kzyjc.2022.1012
摘要:针对突发事件的复杂性、风险性、特殊性、行为主体知识结构的差异性以及有限性,将大群体智慧引入应急决策中,提出一种应用新的融合主体知识水平的方案选择方法.首先,在公众层面基于偏好序列向量和改进的知识测量公式确定公众的知识水平,依据分歧矩阵和控制者进行公众聚类并对子群间的知识水平标准化,形成基于公众行为知识水平的方案排名矩阵;然后,在专家层面基于多粒度二元语义和灰色关联模型确定专家的知识水平和属性权重,通过聚合算子得到专家对方案的评估信息并形成专家对方案排名的支持矩阵;接着,引入参考公众共识阈值,形成融合上述双重主体的共识矩阵,并进行方案排序;最后,通过Covid-19案例和对比分析验证所提出方法的有效性和合理性.
2024, 39(5):1687-1696. DOI: 10.13195/j.kzyjc.2022.1790
摘要:德州扑克中,相比于采用均衡策略求解的方法,对手利用是针对存在弱点的对手以获取更大收益的更有效方法.然而在面对一个全新对手时,在线条件下如何高效利用对手仍然是一大难题.现有方法常采用离线训练在线适应的方式来避开这一问题,即利用学习、演化等方法,通过海量离线训练来获得具有对手适应性的模型,使其能在比赛中适应不同的对手,而不是在比赛中针对一个新对手在线主动地优化自身策略.对此,以在线主动策略优化实现有效对手利用为目的,基于时间维的粒子定义提出一种基于粒子群优化的策略优化方法,将在线策略优化的思路引入德州扑克这种具有强随机性的博弈问题中,开展对手利用并实现在线比赛收益最大化.针对适应度计算受随机运气影响以及部分对手针对性策略难以优化的问题,提出一种基于局部最优解替代、全局最优解替代的改进粒子群优化算法(BR-PSO).实验结果表明,对于标准PSO方法难以针对的对手,所提出的方法能有效获得对手的针对性策略以实现最大化对手利用,而且优化策略的收益能够媲美基于手牌预测AI的收益.
2024, 39(5):1697-1706. DOI: 10.13195/j.kzyjc.2022.1497
摘要:针对已有的信任测度模型中信任源出现的冗余以及之间的干扰未被考虑的缺点,提出一种基于干扰效应的社会网络信任测度的决策模型.该模型在计算决策者之间的信任值时,通过简化信任源类型可避免部分信任源的重复出现,同时增加了信任源之间的干扰项.首先,根据社会关系与背景对信任的决定性,将决策者之间信任关系的来源划分为“决策者之间的亲近关系”和“决策者的客观背景”;其次,提出“亲疏度”和“专业度”的概念作为这两个信任源的测度,在保证信任源完整的前提下,克服信任关系冗余的缺陷;然后,进一步设计考虑干扰效应的信任值量化方法,所求的信任值能够综合体现两个信任源的个体决定程度和整体影响程度;最后,将决策者的信任值转化为权重聚集决策者偏好,以解决实际群决策问题.数值和理论结果表明,所提出考虑干扰效应的信任测度方法能够作为提高信任关系的准确性以及解决社交网络群决策问题的工具,具有广泛的应用前景.
2024, 39(5):1707-1717. DOI: 10.13195/j.kzyjc.2022.1317
摘要:图像的视觉特征对实现零样本图像分类有至关重要的作用.尽管目前VGG、GoogLeNet和ResNet等网络提取的深度特征在图像分类领域获得了广泛的应用,但其在零样本图像分类问题上的表现并不理想,仍旧存在较大的提升空间.此外,由于零样本学习场景下训练集与测试集不相交的设定,导致分类网络不可避免地存在领域偏移问题.为此,提出一种基于自监督增强特征的直推式零样本图像分类框架.首先,通过辅助任务构造伪标签,利用自监督学习获得图像的自监督特征并将其与无监督深度特征进行特征融合;然后,将融合特征嵌入语义空间中进行零样本图像分类,并获得未见类的初始预测标签;最后,利用未见类特征和预测标签迭代地优化视觉-语义映射.所提出框架组件可选择,框架组件自监督网络、主干网络和降维网络分别选用CFN、VGG16和PCA构成网络.在CUB、SUN和AwA2数据集上的实验结果表明,所提出网络能够增强特征的判别能力,在零样本图像分类问题上表现良好.
2024, 39(5):1718-1726. DOI: 10.13195/j.kzyjc.2022.1802
摘要:现有网络安全态势评级方法难以同时兼顾专家间信任信息、偏好信息以及客观异质信息等多源信息,为此,建立基于群体信任的网络安全态势多维偏好评级模型.在描述网络安全态势多维偏好评级问题的基础上,提出社会网络中信任信息不确定程度度量方法,进一步建立一种考虑单链信任信息不确定性和内部差异性、多链间信任非补偿性和内部差异性的不完整信任网络构造模型,据此确定专家权重;定义基于级别特征值的客观排序、专家偏好的群体一致性程度和群体非一致性程度,进一步建立包含专家信任信息、偏好信息和评级信息等在内的网络安全态势评级多维偏好分段变权综合优化模型,获得基于二元语义的网络安全态势等级和等级区分度.所提出方法为构建和检验网络安全态势评级提供理论依据,有助于研发先进的网络安全态势评级系统,提高网络安全防护能力.
2024, 39(5):1727-1735. DOI: 10.13195/j.kzyjc.2022.0624
摘要:为了有效求解多平台协同火力分配问题,根据“分而治之”的思想,基于任务分解策略将复杂的决策任务分解为子目标平台选择和子平台火力分配两个阶段,通过融合启发式算法和强化学习模型,提出一种新的强化学习求解方法(HARL),并以多平台联合火力打击为作战背景进行实验仿真.子目标平台选择层根据当前状态,基于强化学习策略选择攻击当前子目标最适合的火力平台;而子平台火力分配层则使用启发式算法为执行攻击任务的平台规划最优的火力分配方案.实验结果表明,融合启发式算法和强化学习的HARL方法相比于传统的强化学习算法武器消耗量减少15%以上,相比于经典的启发式算法求解时效性提升20%以上,表明该研究成果可为未来求解复杂作战决策问题提供有力的技术支持.
2024, 39(5):1736-1744. DOI: 10.13195/j.kzyjc.2022.1785
摘要:钢铁行业作为最大的碳排放主体,面对日益增大的环保压力,亟待改进工艺流程,提升以废钢为原材料的绿色清洁生产比例.对此,运用博弈论和混沌理论研究环保压力和废钢质量水平对供应链各博弈主体的影响.研究结果表明,外部环保压力的增大会促使钢铁企业逐步向以废钢为主要原料的清洁炼钢模式过渡,逐步提高废钢原料的质量才能使得废钢供应商和钢铁企业达到最优利润.然而,提高废钢原料的质量水平并不利于增强系统的稳定性.当前以铁矿石为主要原材料的钢铁冶炼模式应平稳渐进地向以废钢为原料的清洁生产模式过渡,并通过大数据等信息化技术加强钢铁市场的价格监管,引导企业自律,遵守市场规律调节原材料的价格;否则,价格调整参数超出阈值会导致整个钢铁市场动荡,甚至可能出现经济混沌以及钢铁企业破产.
2024, 39(5):1745-1753. DOI: 10.13195/j.kzyjc.2022.1705
摘要:针对一类离散线性系统,在有限频域范围内研究基于观测器的迭代学习控制问题.首先,结合二维系统理论,构建由基于观测器的状态反馈和PID型前馈学习项组成的控制器;然后,借助于广义Kalman-Yakubovich- Popov(KYP)引理,将闭环系统有限频域性能规范转换为相应的线性矩阵不等式(LMI),进而得到控制器和观测器存在的充分条件,同时,该条件也确保闭环控制系统的稳定性和跟踪误差单调收敛性;最后,通过桁架机器人系统的仿真,验证所提出设计方法的有效性.
2024, 39(5):1754-1760. DOI: 10.13195/j.kzyjc.2023.0500
摘要:二分-分量一致性是指网络系统中部分具有相似特性智能体的某些分量随时间推移趋于相同的值,而剩余智能体的某些分量则随时间趋于相反的值,是一种弱于恒同一致和二分一致的动力学行为.为此,对符号网络上非线性多智能体系统的二分-分量一致性问题展开研究.首先,针对多智能体系统中各智能体之间存在的合作关系或竞争关系,设计有效的自适应牵制控制器;随后,基于Lyapunov稳定性理论和矩阵理论,导出该非线性系统二分-分量一致性得以实现的充分条件;最后,通过数值模拟验证理论结果.
办公地点:东北大学 综合楼313室
通讯地址:沈阳市和平区文化路3巷11号 东北大学125信箱 《控制与决策》编辑部(110819)
收件人:《控制与决策》编辑部 (如果快递,请选择EMS或顺丰快递,其他快递无法送达。)
电话: 024-83687766,23906437
版权所有 :控制与决策
技术支持:北京勤云科技发展有限公司
E-mail: kzyjc@mail.neu.edu.cn
版权所有 :控制与决策
技术支持:北京勤云科技发展有限公司