期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

文永明石晓荣黄雪梅余跃《宇航学报》2021,42(4):504-512

针对复杂场景下无人机集群对抗中协同目标分配和突防轨迹规划等多耦合任务的决策问题,提出了一种集群对抗多耦合任务智能决策方法.首先,针对无人机集群对抗中耦合任务多和决策空间大难题,结合集中式和分层式架构的优点,设计了面向多耦合任务的混合式深度强化学习架构,可提升多耦合任务间的协同性和集群对抗效能;其次,针对轨迹规划序贯决策... 相似文献

2.

基于多智能体深度强化学习的多星观测任务分配方法

下载免费PDF全文

王桢朗何慧群周军金云飞《上海航天》2024,41(1):108-115

为应对多星环境中复杂多约束条件下的任务分配场景,提出一种多星自主决策观测任务分配算法,该算法采用基于集中式训练、分布式执行的多智能体深度强化学习算法。通过这种方式训练后的卫星智能体,即使在没有中心决策节点或通信受限的情况下,仍具有一定的自主协同能力及独立实现多星观测任务的高效分配能力。相似文献

3.

基于多阶段决策的侦察卫星任务规划研究

乔熔岩赵新国《航天电子对抗》2014,(6):30-34

为解决侦察卫星任务规划中合理分配任务和避免信息传输冲突的问题,建立了基于多阶段决策的侦察卫星任务规划模型,包括任务分配模型和传输调度模型,并根据运筹学的基本原理,给出了求解模型的基本方法,从求解结果来看,该模型具有一定的理论与应用价值。相似文献

4.

无人机集群路径规划算法研究综述

刘君兰张文博姬红兵朱明哲《航天电子对抗》2022,38(1):9-12

无人机集群路径规划算法是无人机集群控制的重要研究方向之一.多无人机路径规划相较于单无人机路径规划,会考虑空间协同和时间协同约束、飞行安全等问题.首先对无人机集群路径规划算法进行分类,分为传统路径规划算法、智能优化算法和深度强化学习算法.其次对各类算法进行简要分析和总结,针对缺陷,给出相应的改进思路及例子.再着重对深度强... 相似文献

5.

基于通信的协作型多智能体强化学习算法综述

田琪吴飞《航天控制》2023,(4):13-19

多智能体系统在许多实际领域中得到了广泛应用,包括机器人技术、分布式控制和多人游戏等。这些领域中的许多复杂任务无法通过预定义的智能体行为来解决,而基于通信的多智能体强化学习(Multi-Agent Reinforcement Learning, MARL)技术是应对这些挑战的有效方法之一。该领域存在2个核心问题：1)如何建立有效的多智能体通信机制,从而提升多智能体系统的整体性能;2)在带宽受限的场景下,如何设计高效的通信调度方案从而压缩通信过程中冗余信息。本文首先对处理这两个核心问题的文献进行了概述并重点介绍具有代表性的一些工作,接着说明其在航天领域的应用前景,最后进行总结。相似文献

6.

跨传感器异步迁移学习的室内单目无人机避障

下载免费PDF全文

李湛薛喜地杨学博孙维超于兴虎高会军《宇航学报》2020,41(6):811-819

针对强化学习策略由仿真环境向实际迁移困难的问题,以提高无人机采用无深度信息单目视觉时的行人规避能力为目标,提出一种基于异步深度神经网络结构的跨传感器迁移学习方法。首先,在仿真环境中仅使用虚拟单线激光雷达作为传感器,通过基于确定性策略梯度(DDPG)的深度强化学习方法,训练得到一个稳定的初级避障策略。其次,用单目摄像头和激光雷达同步采集现实环境中的视觉和深度数据集并逐帧绑定,使用上述初级避障策略对现实数据集进行自动标注,进而训练得到无需激光雷达数据的单目视觉避障策略,实现从虚拟激光雷达到现实单目视觉的跨传感器迁移学习。最后,引入YOLO v3-tiny网络与Resnet18网络组成异步深度神经网络结构,有效提高了存在行人场景下的避障性能。相似文献

7.

一种高速可变形飞行器智能变形决策方法

下载免费PDF全文

张远黄万伟聂莹路坤锋《宇航学报》2022,43(12):1665-1675

针对一类高速可变形飞行器(HMFV)的变形决策问题,提出一种基于深度确定性策略算法(DDPG)下考虑综合性能指标最优的智能变形决策方法。首先,以一类后掠角可连续变化的高速飞行器为研究对象,给出变形飞行器动力学模型,分析模型特性及变形量与关键气动参数之间的定性关系。其次,基于关键气动数据特征分析,考虑包含气动性能、控制误差在内的综合性能指标,设计一种基于DDPG算法的智能变形决策方案。再者,针对带有标称控制器的HMFV进行变形决策训练,实时获得滑翔过程中不同飞行状态下的最优构型。最后,仿真结果表明所设计的智能变形决策算法收敛效果好,且具备较好的泛化性能。相比于固定外形,可通过变形使得在不同状态下的升阻比保持最优,且与考虑单一决策指标相比,考虑综合指标最优的变形决策可进一步缩小姿态动态跟踪误差。相似文献

8.

基于可靠性评估的无人机零部件维修决策

谭壹方申翰林高丽霞《航天控制》2019,37(3):61-66,72

为了能够根据可靠性状态制定无人机零部件的维修维护策略,提出一种基于可靠性评估的无人机零部件维修决策方法。该方法首先建立无人机零部件的可靠性评估模型,根据故障样本得到其退化过程参数,进而求解可靠性指标,根据阈值分析和可靠性评估结果进行维修时间决策。以实际使用中的无人机故障情况为例,按所提方法进行了仿真分析,结果表明该方法能够对无人机零部件的可靠性进行有效评估,制定相应的维修策略,对保证无人机的正常服役与使用具有重要意义。相似文献

9.

基于多智能体强化学习的轨道追逃博弈方法 总被引：1，自引：0，他引：1

下载免费PDF全文

许旭升党朝辉宋斌袁秋帆肖余之《上海航天》2022,39(2):24-31

针对空间轨道博弈过程中的集群卫星和非合作目标追逃博弈情形下的动力学模型复杂、非合作目标机动信息未知,以及卫星间难以有效协调等问题,提出一种基于多智能体深度强化学习算法的集群卫星空间轨道追逃博弈方法.首先通过对博弈场景进行建模,在考虑最短时间、最优燃料以及碰撞规避的情形下进行奖励函数的塑造和改进,利用深度强化学习方法中的... 相似文献

10.

复杂不确定性下多无人机的抗扰时变编队控制

下载免费PDF全文

董朝阳张文强王青《宇航学报》2020,41(3):319-328

针对存在不确定非线性动态和外部时变干扰的多无人机系统的时变编队问题,提出了基于扩张状态观测器(ESO)的抗扰编队控制方法。首先建立了分布式ESO来估计多无人机系统的不确定性,基于ESO的输出提出了抗扰编队控制律,并提出一套算法来对控制律进行参数选定。然后,通过分析得到基于该控制律下,多无人机系统实现抗扰时变编队所需要的充要条件,并最终严格证明了在满足编队充要条件和基于提出的控制律下,多无人机系统可以稳定实现抗扰时变编队。最后仿真结果表明理论方法的有效性。相似文献

11.

一种基于信息融合的深空巡航段自主导航算法

常晓华崔平远崔祜涛《上海航天》2010,27(3):22-25,45

针对自主光学导航在深空巡航段应用中的问题,提出了一种基于信息融合的自主导航算法。由太阳敏感器测量获得太阳相对探测器的视线矢量,由分光计测量获得探测器相对太阳的径向速度,构建自主导航系统的两种信息观测方程;由基于状态估计误差协方差阵奇异值动态确定信息分配因子,用信息融合技术和扩展卡尔曼滤波算法实时估计探测器的位置与速度。对深度撞击任务的实际飞行数据的数值仿真结果表明:自主导航算法的轨道确定精度满足深空巡航段要求。相似文献