摘 要: | 本文针对复杂多变环境下的飞行器过载和姿态智能控制问题,提出了一种基于柔性动作-评价(Soft Actor-Critic,SAC)强化学习算法的分布式智能体控制算法,建立了分布式高效环境交互的深度强化学习算法框架和飞行器过载和姿态智能控制算法系统,增加了强化学习算法训练的数据量级和数据分布,提高了飞行器控制算法的性能和鲁棒性。通过在仿真环境中的实验结果表明,基于训练得到的智能体能够有效地在无人飞行器仿真过程中进行过载和姿态控制,分布式SAC算法在无人飞行器仿真场景中的控制效果优于原始SAC算法。
|