P411﹥《基于PIML的微观人群移动建模仿真与干预决策框架》
概述:人群移动是影响城市公共安全及应急管理的重要因素,如何对其进行高精度的建模仿真和有效干预是亟待解决的问题。为此,提出一种物理信息机器学习驱动的微观人群移动建模仿真与干预决策框架。基于平行智能思想,该框架构建“数据感知-融合建模-动态仿真-智能干预”四层闭环结构,形成从建模仿真到策略生成、执行及反馈修正的完整链路。针对人群的移动仿真与引导决策问题,分别提出基于物理信息时空图卷积网络的导航势能场模型和物理信息多智能体深度确定性策略梯度算法,有效解决了传统方法中模型准确性较差、仿真与干预孤立以及决策依赖人工经验的问题。最后,基于真实数据集开展仿真实验验证了所提框架的有效性。
作者简介:郭润康,国防科技大学系统工程学院博士研究生. 主要研究方向为复杂系统建模与仿真.;E-mail: guorunkangnudt@nudt.edu.cn。
朱正秋,国防科技大学数智建模与仿真国家级重点实验室副研究员;主要研究方向为复杂系统建模与仿真,群智计算,具身智能;E-mail: zhuzhengqiu12@nudt.edu.cn。
引用:郭润康, 朱正秋, 艾川, 等. 基于PIML的微观人群移动建模仿真与干预决策框架[J]. 自动化学报 . 2026 ,52 (03) : 411-429.
全文:点击下载
P451﹥《基于行为预测和策略融合的轨道博弈决策方法》
概述:轨道追逃博弈中逃逸策略的高度未知性与行为多样性,给追踪策略的泛化能力带来严峻挑战。深度强化学习虽可提升追踪星的博弈效能,但当逃逸策略偏离训练分布时,策略网络易产生次优甚至失效的决策。为此,提出一种基于行为预测和策略融合的轨道博弈决策方法。在训练阶段,首先采用“预测制导+人工势场法”构建多样化逃逸策略集。随后在传统演员-评论家训练框架的基础上,通过引入预测网络构建预测器-演员-评论家算法,针对每类逃逸策略分别训练以获得对应的追踪子策略。其中预测网络用于估计逃逸星动作,并通过预测结果与真实动作的相似性衡量子策略与未知逃逸策略的匹配度。在执行阶段,策略融合器以逃逸星历史动作与各追踪子策略的预测结果为输入,动态计算匹配度并选择最优子策略进行博弈决策。实验结果表明,预测网络能有效评估追踪子策略对未知逃逸策略的适应性,策略融合器可显著提升追踪星面对多样化逃逸策略的泛化能力与可靠性。
作者简介:王英杰,北京控制工程研究所博士研究生;主要研究方向为轨道追逃博弈,多智能体强化学习;E-mail: wangyj980311@163.com。
袁利,中国空间技术研究院研究员;主要研究方向为航天器自主控制,鲁棒容错控制技术;E-mail: yuanli@spacechina.com。
引用:王英杰, 袁利, 黄煌, 等. 基于行为预测和策略融合的轨道博弈决策方法 [J]. 自动化学报 . 2026 ,52 (03): 451-462.
全文:点击下载
P510﹥《深度强化学习驱动的超视距空战自主决策方法》
概述:随着机载传感器和中远距空空导弹技术的快速发展,超视距空战已经成为现代空战的主流形式。在这种复杂多变的作战环境中,开发能够实时掌握战场态势并制定合理机动决策的智能化技术,已成为军事技术研究领域的热点问题。首先,构建一个涵盖飞机六自由度动力学模型、导弹制导系统模型和雷达传感器系统的高保真仿真环境;接着,融合模仿学习和自博弈方法,提出基于对手学习的空战决策框架,以解决深度强化学习在空战中适应性和泛化性差的缺点,提升智能体在复杂多变战场环境中快速适应和策略优化的能力;最后,构建10种具有显著战术差异性的专家系统,在高保真空战仿真平台中与智能体进行博弈对抗。结果表明,在收敛速度和胜率等关键指标上,所提出的空战决策框架优于传统深度强化学习决策策略,有效性和泛化性强,可为复杂超视距空战态势下快速生成可靠策略提供技术支持。
作者简介:吕茂隆,国家级青年人才,空军工程大学副教授,荷兰代尔夫特理工大学博士;主要研究方向为集群无人机协同打击,有人−无人协同空战,智能空战;E-mail: maolonglv@163.com。
引用:吕茂隆, 王金河, 韩浩然, 等. 深度强化学习驱动的超视距空战自主决策方法[J]. 自动化学报 . 2026 ,52 (03): 510-524.
全文:点击下载
P525﹥《基于局部分形维数最大化的单幅图像细节增强》
概述: 随着人们对图像画质要求的不断提高,各类图像细节增强技术不断涌现。然而,基于局部滤波器速度较快,但其细节增强效果往往有限;全局滤波器效果突出,但计算开销较大;深度学习方法高度依赖人工标注数据,且其缺乏可解释性;基于残差学习的策略则容易陷入局部最优,难以充分挖掘潜在的全局最优特征。针对上述挑战,提出一种基于局部分形维数最大化的图像细节增强算法。研究发现,图像的分形维数在一定程度上能够有效刻画图像纹理结构,其空间分布呈现出一定规律:边缘区域通常具有较高的分形维数,纹理区域次之,平坦区域则最低,基于上述特性,构建图像纹理特征与分形维数之间的映射关系,并进一步探讨分形维数与图像细节层之间的内在关联机制。该方法在保持整体结构一致性的前提下,通过提升局部分形维数,实现图像细节的有效增强,进而为图像增强提供一种具有理论依据的新思路。大量实验结果表明,该方法在主观视觉感受和客观评价指标上具有竞争力的表现。如在BSDS200数据集上进行四倍增强因子的测试中,所提方法在峰值信噪比和结构相似度指标上相较于当前流行方法 QWLS分别提升5.20 dB和0.145 6,充分展示了其在图像细节增强任务中的优势与算法强大的泛化特性。
作者简介:江鹤,中国矿业大学信息与控制工程学院讲师;主要研究方向为图像复原与增强, 检测与识别;E-mail: jianghe@cumt.edu.cn。
程德强,中国矿业大学信息与控制工程学院教授;主要研究方向为计算机视觉,图像处理;E-mail: chengdq@cumt.edu.cn。
引用:江鹤, 乙夫迪, 郑州, 等. 基于局部分形维数最大化的单幅图像细节增强 [J]. 自动化学报 . 2026 ,52 (03): 525-540.
全文:点击下载
P555﹥《非线性多智能体系统的动态事件触发固定时间一致性控制》
概述:研究通信拓扑固定下受有界扰动影响的非线性多智能体系统固定时间一致性问题。针对现有事件触发控制方法存在的收敛时间依赖初值、扰动下触发可靠性低、控制参数缺乏理论设计依据等挑战,提出一种动态事件触发固定时间一致性控制方法。首先,设计融合非线性增益与双曲正切扰动补偿的固定时间控制器,在消除抖振的同时保证收敛时间上界严格独立于系统初始状态。其次,构造基于动态变量自适应调节的事件触发机制,显著降低通信频率并严格证明系统不存在Zeno行为。进一步,通过建立新型Lyapunov稳定性分析框架,显式给出收敛时间上界与事件触发间隔下界。仿真结果表明,所提方法在保证固定时间收敛性能的同时,有效实现通信效率的优化提升。
作者简介:邵蝉云,兰州理工大学自动化与电气工程学院硕士研究生;主要研究方向为多智能体系统协同控制;E-mail: 14719449252@163.com。
安爱民,兰州理工大学自动化与电气工程学院教授;主要研究方向为复杂系统建模与智能协同优化控制技术,机器人智能感知与控制理论及其应用,多种可再生能源综合优化发电技术;E-mail: anaiminll@163.com。
引用:邵蝉云, 安爱民, 徐承承, 等. 非线性多智能体系统的动态事件触发固定时间一致性控制[J]. 自动化学报 . 2026 ,52 (03): 555-577.
全文:点击下载