共查询到11条相似文献,搜索用时 46 毫秒
1.
2.
3.
为解决侦察卫星任务规划中合理分配任务和避免信息传输冲突的问题,建立了基于多阶段决策的侦察卫星任务规划模型,包括任务分配模型和传输调度模型,并根据运筹学的基本原理,给出了求解模型的基本方法,从求解结果来看,该模型具有一定的理论与应用价值。 相似文献
4.
5.
多智能体系统在许多实际领域中得到了广泛应用,包括机器人技术、分布式控制和多人游戏等。这些领域中的许多复杂任务无法通过预定义的智能体行为来解决,而基于通信的多智能体强化学习(Multi-Agent Reinforcement Learning, MARL)技术是应对这些挑战的有效方法之一。该领域存在2个核心问题:1)如何建立有效的多智能体通信机制,从而提升多智能体系统的整体性能;2)在带宽受限的场景下,如何设计高效的通信调度方案从而压缩通信过程中冗余信息。本文首先对处理这两个核心问题的文献进行了概述并重点介绍具有代表性的一些工作,接着说明其在航天领域的应用前景,最后进行总结。 相似文献
6.
针对强化学习策略由仿真环境向实际迁移困难的问题,以提高无人机采用无深度信息单目视觉时的行人规避能力为目标,提出一种基于异步深度神经网络结构的跨传感器迁移学习方法。首先,在仿真环境中仅使用虚拟单线激光雷达作为传感器,通过基于确定性策略梯度(DDPG)的深度强化学习方法,训练得到一个稳定的初级避障策略。其次,用单目摄像头和激光雷达同步采集现实环境中的视觉和深度数据集并逐帧绑定,使用上述初级避障策略对现实数据集进行自动标注,进而训练得到无需激光雷达数据的单目视觉避障策略,实现从虚拟激光雷达到现实单目视觉的跨传感器迁移学习。最后,引入YOLO v3-tiny网络与Resnet18网络组成异步深度神经网络结构,有效提高了存在行人场景下的避障性能。 相似文献
7.
针对一类高速可变形飞行器(HMFV)的变形决策问题,提出一种基于深度确定性策略算法(DDPG)下考虑综合性能指标最优的智能变形决策方法。首先,以一类后掠角可连续变化的高速飞行器为研究对象,给出变形飞行器动力学模型,分析模型特性及变形量与关键气动参数之间的定性关系。其次,基于关键气动数据特征分析,考虑包含气动性能、控制误差在内的综合性能指标,设计一种基于DDPG算法的智能变形决策方案。再者,针对带有标称控制器的HMFV进行变形决策训练,实时获得滑翔过程中不同飞行状态下的最优构型。最后,仿真结果表明所设计的智能变形决策算法收敛效果好,且具备较好的泛化性能。相比于固定外形,可通过变形使得在不同状态下的升阻比保持最优,且与考虑单一决策指标相比,考虑综合指标最优的变形决策可进一步缩小姿态动态跟踪误差。 相似文献
8.
9.
10.
针对存在不确定非线性动态和外部时变干扰的多无人机系统的时变编队问题,提出了基于扩张状态观测器(ESO)的抗扰编队控制方法。首先建立了分布式ESO来估计多无人机系统的不确定性,基于ESO的输出提出了抗扰编队控制律,并提出一套算法来对控制律进行参数选定。然后,通过分析得到基于该控制律下,多无人机系统实现抗扰时变编队所需要的充要条件,并最终严格证明了在满足编队充要条件和基于提出的控制律下,多无人机系统可以稳定实现抗扰时变编队。最后仿真结果表明理论方法的有效性。 相似文献