基于深度迁移强化学习的无人机投放自主引导机动控制算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于深度迁移强化学习的无人机投放自主引导机动控制算法

引用本文：	张堃,李珂,邹杰,栗鸣,李阳.基于深度迁移强化学习的无人机投放自主引导机动控制算法[J].航空科学技术,2023(11):103-110.

作者姓名：	张堃李珂邹杰栗鸣李阳

作者单位：	1. 西北工业大学;2. 洛阳电光设备研究所空基信息感知与融合全国重点实验室;3. 西安机电信息技术研究所;4. 航空工业沈阳飞机设计研究所

基金项目：	航空科学基金（20200051053001）；;中央高校基本科研业务费（D5000230311,G2023KY0601）~~；

摘要：	针对无人机精确投放引导问题，本文提出基于深度迁移强化学习的无人机投放自主引导机动控制算法，分别建立基于马尔可夫决策过程的引导机动决策模型、引导机动评估模型等，并设计基于迁移学习和课程学习的引导机动策略训练方法，拟合基于深度学习的引导机动策略和评估网络，最后开展仿真训练和验证试验。仿真结果表明，该算法实现了无人机在任意姿态和位置条件下，能够自主规避区域威胁并自主引导至目标投放点，成功完成投放瞄准任务，有效地提升了无人机投放引导机动控制的自主性。
关键词：	投放引导机动控制深度迁移强化学习投放瞄准马尔可夫决策过程