首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对大气层内高速机动目标的拦截问题,提出了一种基于双延迟深度确定性策略梯度(TD3)算法的深度强化学习制导律,它直接将交战状态信息映射为拦截弹的指令加速度,是一种端到端、无模型的制导策略。首先,将攻防双方的交战运动学模型描述为适用于深度强化学习算法的马尔科夫决策过程,之后通过合理地设计算法训练所需的交战场景、动作空间、状态空间和网络结构,并引入奖励函数整形和状态随机初始化,构建了完整的深度强化学习制导算法。仿真结果表明:与比例导引和增强比例导引两种方案相比,深度强化学习制导策略在脱靶量更小的同时能够降低对中制导精度的要求;具有良好的鲁棒性和泛化能力,并且计算负担较小,具备在弹载计算机上运行的条件。  相似文献   

2.
针对多无人机任务决策方法研究中传统优化算法难以在短时间内得到期望结果的问题,基于深度强化学习提出一种无人机多智能体深度确定性策略梯度(MADDPG)算法,通过允许无人机在学习时使用全局信息,在应用决策的时候只使用局部信息的方法,从网络结构、状态空间、动作空间和奖励函数设计了MADDPG算法的模型结构。最后通过仿真实验,并对比深度确定性策略梯度(DDPG)算法,验证了本文提出的MADDPG算法在保证精度的基础上,学习速度大幅度提高,弥补了传统强化学习算法在多智能体领域的不足。  相似文献   

3.
为提高导弹在攻击角度约束下对目标的打击效能,提出了一种基于深度确定性策略梯度算法的分布式强化学习制导策略。为了最大限度地减小攻击角度误差,设计了一种新的奖励函数,使导弹在满足视场角约束的同时,视线角向期望值收敛。此外,为了增强强化学习模型的泛化能力,提出了一种分布式探索策略,提高了模型训练过程中对环境的探索效率。仿真结果验证了所提出的分布式强化学习制导方法能够在固定攻击角度约束下实现对目标的精准打击。与传统制导律相比,所提制导方法的攻击角度误差更小,收敛速度更快。  相似文献   

4.
基于DDQN的运载火箭姿态控制器参数设计   总被引:1,自引:0,他引:1  
探索了利用深度强化学习算法训练智能体,以代替人类工程师进行火箭姿态控制器参数的离线设计方案。建立了多特征秒的火箭频域分析模型,选定了设计参数。选择深度强化学习算法中的双深度Q学习(Double Deep Q Network,DDQN)算法,通过记忆回放和时间差分迭代的方式让智能体在与环境交互过程中不断学习。设计了对应的马尔科夫决策过程模型,进行了智能体的训练和前向测试。结果说明该方法对于运载火箭姿控设计具有一定参考价值。  相似文献   

5.
针对侧窗导弹末制导问题,提出了一种侧窗探测视场约束条件下的制导控制一体化设计方法。基于弹目相对运动模型分析了侧窗导弹运动规律,建立侧窗导引头探测视场角范围与导弹姿态角的约束关系,采用基于滑模控制理论的反步法设计导弹的制导控制一体化模型,给出了自适应滑模制导律:根据姿态角与侧窗视线角的约束关系,切换选择含约束和不含约束的自适应滑模控制。控制策略为:当弹目视线不满足侧窗探测范围约束时,在控制量中加入自适应俯仰角补偿项,使目标始终处于导弹侧窗视线范围内,解决了侧窗末制导过程中存在的目标跟踪视场角不对称约束问题;当弹目视线满足侧窗探测范围约束时,控制无需引入姿态角约束项,可直接应用自适应滑模控制律。仿真结果表明:在末制导过程中目标始终处在侧窗范围内,且对不同的初始条件有较好的鲁棒性。  相似文献   

6.
轨控式复合控制导弹制导与控制一体化反步设计   总被引:1,自引:0,他引:1  
舒燕军  唐硕 《宇航学报》2013,34(1):79-85
针对轨控式复合控制导弹制导与控制一体化设计问题,结合动态面反步设计和非线性干扰观测器(NDO)技术,设计了一种基于非线性干扰观测器的制导控制一体化反步控制方法.首先建立了复合控制导弹纵向通道制导控制一体化模型,在此基础上分三步设计反步控制器,设计过程中采用了动态面方法,通过引入一阶低通滤波器,得到虚拟控制量的微分,避免了传统反步设计中的“计算膨胀”问题,同时采用NDO对模型不确定性进行估计并加以补偿,实现了对气动系数摄动和目标机动的鲁棒性.基于李亚普诺夫稳定性理论证明了闭环系统所有误差信号最终一致有界.仿真结果表明本文设计的基于非线性干扰观测器的复合控制导弹制导控制一体化反步设计方案的正确性和有效性.  相似文献   

7.
从强化学习的角度,对在轨目标逼近问题进行研究,设计了一种整合制导与控制的端到端的算法.首先对在轨目标逼近问题进行数学建模;然后对强化学习算法原理进行简介,根据问题特点分析不同强化学习框架的优劣,确定以DDPG作为算法框架,并设计了基于强化学习的在轨目标逼近算法;最后通过仿真验证,分析了基于强化学习逼近算法的优劣性.  相似文献   

8.
黄鲁豫  曲鑫  凡永华  王俊波 《宇航学报》2021,42(9):1108-1118
针对导弹在俯冲机动突防飞行过程中攻角及落地弹道倾角受到约束的问题,基于自抗扰控制(ADRC)及反步滑模控制(SMC),提出一种多约束条件下的导弹螺旋机动制导控制一体化设计方法。首先,基于典型的螺旋机动突防弹道,同时考虑纵向平面指定落角约束,分通道进行制导控制一体化数学模型推导。然后,使用反步滑模控制进行制导控制一体化算法设计,通过设计补偿器对反步法的中间控制量进行修正实现对攻角的约束,针对系统的有界不确定性以及未知干扰,采用干扰观测器进行估计与补偿,提高系统的鲁棒性。最终使用Lyapunov理论证明了系统稳定。仿真结果表明,本文方法具有较强的鲁棒性,能够保证飞行器在满足攻角约束的条件下,按照典型螺旋机动弹道对目标进行大落角高精度打击。  相似文献   

9.
为解决导弹总体设计中亚跨速稳定性和超声速机动性不能兼顾的问题,对双通道控制旋转导弹舵面控制律进行了研究。分析了正弦、Bang-Bang、梯形和饱和正弦等控制律的原理与特点,给出了各自的等效舵偏角及其相应等效控制力的数学模型。采用基于两对舵面配合控制方式,给出了上述4种控制律的统一表示形式。讨论了两对舵配合控制方式的影响及工程可实现性,发现两对舵面相位差固定时,其等效控制力的方向由舵面1的相位决定,大小由其最大舵面偏角和特征函数决定,在工程中易实现;两对舵面相位差可变时,等效控制力的大小和方向需由控制舵1的相位和两对舵的相位差共同决定,考虑的变量更多,设计难度大,舵机系统复杂,难以实现小型化设计。仿真结果表明:采用基于两对舵面配合控制的旋转弹双通道控制方式,通过改变导弹舵面控制律,能有效提高导弹的操纵效率,在保证弹体静稳定性的同时增强导弹的机动能力,有效解决了传统旋转导弹总体设计中两者难以兼顾的难题。  相似文献   

10.
胥彪  周荻 《宇航学报》2012,33(11):1630-1635
针对受输入饱和约束的直接侧向力与气动力复合控制的导弹,研究其自动驾驶仪设计问题。导弹的执行机构分别是舵机和侧向脉冲发动机。舵机提供的是连续的控制量,而侧向脉冲发动机提供的是离散的控制量。首先采用最优控制方法设计连续的舵控制器。再对设计好舵控回路的新受控弹体,基于含有界干扰项离散饱和系统不变集分析方法进行直接侧向力控制器的设计。设计过程中,充分考虑了舵偏角的饱和非线性因素以及侧向脉冲发动机点火数取整产生的量化误差。最后,利用数值仿真验证了所提出控制方法的有效性。  相似文献   

11.
面向小行星探测任务的需要,柔性连接的多节点深空探测器是针对单节点探测器着陆易倾覆或反弹等问题的一种解决方案.基于此构建了一种采用柔性连接的三节点探测器并对其软着陆情况进行建模,提出了带自注意力机制的多任务深度强化学习方法.各节点以探测器主体为参照物描述自身状态,节点之间通过联合学习来提高各自对复杂环境的适应能力;在对探...  相似文献   

12.
一种基于迁移学习的遥测数据异常检测方法   总被引:1,自引:0,他引:1       下载免费PDF全文
陈俊夫  皮德常  张强 《宇航学报》2021,42(4):522-530
为解决卫星遥测数据异常检测面临的数据不平衡且缺乏有标签样本的问题,提出一种基于一维卷积神经网络(1dCNN)迁移学习的异常检测方法。首先利用源域卫星的遥测数据对1dCNN进行预训练,使得模型的卷积层具有卫星状态特征的提取能力;然后将训练好的模型迁移到缺乏标签数据的目标域卫星中;利用目标域有标签样本对预训练模型进行微调,从而实现了对目标域测试集样本的异常检测。为了使1dCNN能够适应遥测数据样本的不平衡性,引入了代价敏感训练策略,建立动态损失函数,从而提升代价敏感一维卷积神经网络(cs 1dCNN)对于异常样本的识别能力。以某两个卫星的电源分系统遥测数据进行了验证,实验结果表明该异常检测迁移方法具有较好的有效性和鲁棒性。  相似文献   

13.
基于深度学习的目标检测框架组件研究   总被引:2,自引:2,他引:0       下载免费PDF全文
深度学习与计算机视觉的结合给目标检测研究领域带来了全新的检测模式,通过对基于深度学习的目标检测网络分析研究,目标检测网络框架可模块化地拆分为特征提取网络、多尺度融合和预测网络三个部分。从组成目标检测网络模块化的角度对各个模块进行了详细的分析综述,并给出了如何根据实际需求来构建适合的模型框架建议,为基于深度学习的目标检测方法研究提供参考。  相似文献   

14.
船只目标检测识别技术是现阶段遥感图像研究领域的一个重要发展方向。随着国产高分辨率卫星的快速发展,高分遥感卫星陆续发射,基于光学遥感图像的船只检测识别技术会逐步成为研究热门。主要介绍了近年来基于光学图片的船只检测识别技术发展、以及当前技术存在的问题。当前基于深度学习的船只目标检测识别技术取得了较好的检测效果,成为主流研究方向,但在光学遥感图像船只检测领域基于深度学习的方法有一些基本问题限制了检测效果,对这些问题进行了归纳总结,并对未来光学遥感图像船只检测技术的发展进行了展望。  相似文献   

15.
基于深度学习的目标跟踪技术及其多波段应用研究   总被引:1,自引:1,他引:0       下载免费PDF全文
目标跟踪是计算机视觉领域中最具挑战性的领域之一。首先,回顾了目标跟踪技术发展现状并总结出目标跟踪的一般流程;其次,分析了卡尔曼滤波、粒子滤波等传统目标跟踪方法的优缺点;再次,依次重点介绍了固定窗跟踪等相关滤波目标跟踪方法,以及全网络自适应目标跟踪等高性能目标跟踪方法;最后,总结了目标跟踪在红外、毫米波、太赫兹等波段的应用,并对多波段融合目标跟踪进行了展望。  相似文献   

16.
随着遥感技术的快速发展,光学遥感影像弱小目标智能解译成为遥感信息处理的研究热点之一。遥感影像的地物目标常具有尺度小、种类多、数量大、部分重点小目标移动速度快的特点,易受到复杂背景环境及噪声影响,使得提取遥感影像弱小目标的信息面临着巨大的挑战。早期智能解译算法中的弱小目标分割、检测及跟踪等算法研究,多依赖模板匹配及先验知识,此类算法需耗费大量资源、算力及专家知识成本,存在着计算量大、泛化能力差的问题。近年来,随着深度学习等人工智能技术的快速发展,在海量遥感数据中准确获取弱小目标的信息,通过结合深度学习算法可对弱小目标的特征进行快速提取,以提供高效、准确的解译信息。本文综述了遥感影像弱小目标智能解译算法研究进展,包括基于传统图像处理方法的弱小目标分割、检测和跟踪算法,以及基于深度学习等典型相关算法。通过分析这些方法的优点与局限性,对于提高相关目标的信息获取能力、提升观测的态势感知水平以及未来应用等方面具有重要意义。  相似文献   

17.
18.
提出一种航天器反应式碎片规避动作规划方法,首先以扰动流体动态系统(IFDS)算法作为动作规划的基础算法,通过其中的总和扰动矩阵对航天器的轨道速度矢量进行修正,实现轨道机动规避;然后,建立基于双延迟深度确定性策略梯度(TD3)深度强化学习算法的反应式动作规划方法,通过TD3在线优化IFDS规划参数,实现对碎片群的“状态-动作”最优、快速规避决策。在此基础上,将优先级经验回放和渐进式学习策略引入该方法中,提升训练效率。最后,仿真结果表明,所提方法可使航天器安全规避多发、突发、动态且形状各异的空间碎片群,且具有较好的实时性。  相似文献   

19.
针对欧空局SpotGEO竞赛中地球同步轨道目标物的检测问题,提出面向低精度CCD空间图像的深度学习检测方法。在图像预处理环节,分别采用高斯过程回归和模板匹配实现前景/背景分割和多帧图像配准。根据地球同步轨道物体的运动特征,采用拓扑扫描提取候选目标物。在此基础上,提出一套基于深度学习的目标物筛选方法。该方法利用卷积神经网络,依次对拓扑扫描前后候选目标物进行筛选,显著减少噪声点数量,提高检测效率。仿真结果表明,该方法达到98%的目标检测准确率,适用于存在光污染、云层遮挡等干扰的复杂环境。  相似文献   

20.
雷达前视成像作为雷达成像领域的难点与重点,在自动驾驶、导航、精确制导等方面具有广阔的应用前景。传统的前视成像算法受限于天线孔径的宽度,无法实现高分辨率的成像,本文使用卷积神经网络(Convolutional Neural Networks, CNN)与长短期记忆(Long Short-Term Memory,LSTM)网络相结合实现前视成像中方位向的预测,首先介绍了扫描前视成像信号的类卷积模型及其病态性,利用脉冲压缩以及距离徙动校正对回波信号预处理,输入CNN-LSTM神经网络逐距离单元进行方位向估计。仿真结果表明:算法能有效提高前视成像的方位分辨率,实现前视成像的超分辨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号