排序方式: 共有4条查询结果,搜索用时 125 毫秒
1
1.
2.
3.
研究了一种基于深度强化学习理论的制导控制一体化算法。不同于传统的制导控制一体化算法和制导控制回路分开设计的方法,基于深度强化学习理论的制导控制一体化算法利用深度学习强化算法生成一个智能体,智能体根据导弹的观测量生成舵偏角控制指令准确拦截目标。首先将制导控制问题转化为一个马尔可夫决策过程,然后提出了一个权衡制导精度、能量损耗和飞行时间的奖励函数,将制导控制问题转化到强化学习问题的框架中。最后采用深度确定性策略梯度算法,求解提出的强化学习问题,训练得到制导控制智能体,智能体根据导弹观测量生成舵偏角指令。通过进行大量的数值模拟,验证了提出的制导控制一体化算法的有效性和鲁棒性。 相似文献
4.
针对拦截弹制导律辨识问题,基于门循环单元(GRU)神经网络提出了一种制导律辨识方法。首先,构建了三维空间下的拦截弹-我方飞行器相对运动模型,并假设拦截弹采用经典的比例导引(PN)制导律或增强比例导引(APN)制导律。由相对运动模型提取数据,构成训练样本集和测试样本集,样本输入为敌我双方运动学信息,标签为敌方拦截弹对应的制导律。其次,建立了包含三层隐含层的GRU网络模型,采用基于Adam算法的反向传播对网络进行训练,探究了样本时间跨度等因素对辨识准确度的影响。最后,通过数学仿真对网络参数进行了优化,并在多种条件下进行了仿真验证。结果表明,相比其他网络结构而言,所提方法采用GRU拥有良好的抗噪能力和辨识精度;同时,相比于基于卡尔曼滤波器的制导律辨识模型,所提方法能够大幅减少辨识所需时间。 相似文献
1