首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于CW方程的航天器追逃问题半直接求解方法   总被引:1,自引:1,他引:0       下载免费PDF全文
针对时间固定的两航天器追逃问题,提出一种以半直接配点法研究追逃双方最优控制策略的求解方法。航天器追逃问题是基于微分对策的追逃问题,该问题是含有追逐者和逃逸者控制变量的两点边值问题。若采用必要条件求解,则对迭代初值要求高,收敛困难。在两航天器均为连续小推力的假设条件下,以终端距离为支付函数,给出半直接配点法的求解过程。在此数值方法中,根据半直接转换将微分对策问题转化为最优控制问题,采用Gauss-Lobbato配点法将此最优问题最终转化为非线性规划问题,继而通过序列二次规划算法求解。这种半直接配点法避免了对微分对策问题最优策略的必要条件(两点边值问题)求解。采用该方法求解对迭代初值不敏感,且数值稳定性好。数值仿真实例验证了这种求解方法的可行性。该方法提高了求解两点边值问题的收敛性,为求解含有双方控制变量的微分对策问题提供了一种思路。  相似文献   

2.
采用半直接配点法求解时间固定两航天器追逃问题,提出一种新的数值求解追逃双方最优控制策略的方式,避免了求解非线性两点边值问题。在两航天器均为连续小推力假设条件下,以终端距离为支付函数,给出了半直接配点法求解此追逃问题的过程。在此数值方法中,根据半直接转换将微分对策问题转化为一个最优控制问题,由Gauss-Lobbato配点法最终将此最优问题转化为非线性规划问题,继而通过序列二次规划方法求解。这种半直接配点法避免微分对策问题最优策略的必要条件(两点边值问题)求解,并且数值稳定性好。数值仿真给出了追逃双发的最优控制策略和相应的追逃轨迹。  相似文献   

3.
袁利  耿远卓  汤亮  黄煌 《上海航天》2022,39(4):33-41
针对航天器轨道追逃博弈问题,提出一种多阶段学习训练赋能方法,使得追踪星在终端时刻抵近逃逸星的特定区域,而逃逸星需要通过轨道机动规避追踪星。首先,构建两星的训练策略集,基于逻辑规则设计追踪星和逃逸星的机动策略,通过实时预测对方的终端位置,设计己方的期望位置和脉冲策略,显式给出追逃策略的解析表达式,用于训练赋能;其次,为提升航天器的训练赋能效率及应对未知环境的博弈能力,提出一种基于强化学习技术多模式、分阶段的学习训练方法,先使追踪星和逃逸星分别应对上述逻辑规则引导下的逃逸星和追踪星,完成预训练;再次,开展二次训练,两星都采用邻近策略优化(PPO)策略进行追逃博弈,在博弈中不断调整网络权值,提升决策能力;最后,在仿真环境中验证提出的训练方法的有效性,经过二次训练后,追踪星和逃逸星可有效应对不同策略驱动下的对手,提升追逃成功率。  相似文献   

4.
针对不完全信息下的航天器末端追逃问题,提出了一种满足Epsilon纳什均衡的微分博弈控制策略。首先,建立了完全信息下的有限时间追逃纳什均衡策略对,并将其作为目标航天器实际采取的控制策略,使目标航天器掌握博弈进程的完全信息,进而获得更好的逃逸性能。在此基础上,考虑拦截航天器不能获取目标控制矩阵信息的态势,设计了基于广义卡尔曼滤波的行为学习信息估计算法,使拦截器能够对目标的不完全信息进行估计,并提出了不完全信息下的末端追逃博弈控制策略。经过理论分析,证明了所设计的不完全信息下微分博弈策略对满足Epsilon纳什均衡。最后,仿真结果表明该算法可以有效估计目标的不完全信息,确保拦截器能够在有限时间内快速拦截目标。  相似文献   

5.
机动目标的空间交会微分对策制导方法   总被引:1,自引:0,他引:1       下载免费PDF全文
常燕  陈韵  鲜勇  雷刚 《宇航学报》2016,37(7):795-801
针对目标机动情况,利用定量微分对策方法分析连续推力作用下的空间交会追逃微分对问题,提出用非线性规划求解该微分对策问题的方法,建立空间交会追逃微分对策的非线性规划模型,有效解决了机动目标空间交会微分对策模型高度非线性且难于利用经典最优控制理论进行求解的问题,实现了最优控制与对策论的结合,并通过数值仿真校验了该方法的有效性。  相似文献   

6.
本文研究了地球高阶引力模型中,基于脉冲作用的航天器轨道追逃问题。针对该问题,将航天器轨道追逃问题定义为两选手计算博弈,其中以博弈双方的距离和燃料消耗设计了性能指标函数,并以速度增量大小和方向构建容许控制集。此外,为了保证纳什均衡解的求解效率,引入了快速搜索(ARS)算法,并设计了一种数据剪枝方法用于优化搜索空间,最终实现了基于计算博弈的控制策略的快速求解。仿真结果表明:该方法能够有效解决脉冲作用下航天器的追逃难题,与传统方法相比,该方法能同时满足脱靶量精度和燃料消耗要求,具有一定的可行性和有效性。  相似文献   

7.
基于追逃博弈的非合作目标接近控制   总被引:1,自引:0,他引:1       下载免费PDF全文
针对追踪航天器接近非合作目标任务中的相对位置控制问题,提出了一种基于线性二次型追逃博弈的控制方法。首先,将非合作目标接近问题转化为二人追逃博弈问题,并设计了二次型目标函数。其次,结合相对运动模型,建立了线性二次型追逃博弈模型。为得到纳什均衡策略,将HJ方程转化为代数黎卡提方程,并给出了李雅普诺夫迭代法对其求解。最后,对博弈控制方法的有效性进行仿真验证,结果表明,该方法能够在非合作目标机动时实现轨道接近控制。  相似文献   

8.
柴源  罗建军  韩楠  谢剑锋 《宇航学报》2020,41(2):191-198
针对燃料耗尽的失效航天器姿态接管控制问题,提出多颗微卫星协同实现姿态稳定的状态相关黎卡提方程(SDRE)微分博弈控制方法。首先,将姿态接管问题转化为多颗微卫星的微分博弈问题,基于组合航天器的姿态模型和微卫星的性能指标函数建立多颗微卫星的非线性微分博弈模型,微卫星通过独立优化各自的性能指标函数得到控制策略。其次,引入状态相关系数矩阵,将非线性博弈转化为状态相关线性二次型博弈,采用SDRE方法更方便地逼近微卫星的博弈均衡策略。最终通过李雅普诺夫迭代法求解耦合状态相关黎卡提方程组得到微卫星的状态反馈控制器,实现微卫星的自主决策。数值仿真验证了多颗微卫星采用微分博弈控制方法实现姿态接管的有效性和容错性。  相似文献   

9.
王英杰  袁利  汤亮  黄煌  耿远卓 《宇航学报》2023,(10):1522-1533
针对信息非完备约束下航天器轨道博弈难以自主决策的问题,基于多智能体强化学习提出一种多航天器轨道博弈决策方法。首先建立轨道博弈动力学和信息非完备约束。其次建立用于训练和决策的神经网络模型,依据分布式系统架构对网络的输入输出结构进行设计,并引入具有记忆功能的长短期记忆网络(LSTM),根据航天器轨道运动在时间、空间连续的属性,补偿位置、速度测量信息的非完备性。然后采用近端策略优化(PPO)算法开展红蓝左右互搏式学习训练。最后通过三组对比训练实验,验证了所提出的方法在信息非完备约束下能够有效增强学习训练过程的稳定性,并提升任务完成率和降低燃料消耗。  相似文献   

10.
基于多智能体强化学习的轨道追逃博弈方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对空间轨道博弈过程中的集群卫星和非合作目标追逃博弈情形下的动力学模型复杂、非合作目标机动信息未知,以及卫星间难以有效协调等问题,提出一种基于多智能体深度强化学习算法的集群卫星空间轨道追逃博弈方法.首先通过对博弈场景进行建模,在考虑最短时间、最优燃料以及碰撞规避的情形下进行奖励函数的塑造和改进,利用深度强化学习方法中的...  相似文献   

11.
针对航天器末端拦截博弈问题,基于微分对策理论研究了各星的博弈策略。根据拦截空间是否具有防御器将博弈态势分为双星博弈和三星博弈。首先考虑拦截器与目标的双星博弈态势,以终端脱靶量为指标设计了相对博弈策略,并提出时间分析方程以提高策略对不同拦截态势的自适应性。然后,考虑具有防御器的三星博弈态势,提出了博弈切换策略将其化为分段双星博弈,并将双边时间方程扩展到三星博弈中,使拦截器在不被防御器反拦截的情况下,实现对目标的快速拦截。最后仿真分析了博弈策略与时间分析方程对航天器拦截博弈问题的有效性。  相似文献   

12.
针对集群航天器协同观测任务分配问题,提出一种基于深度神经网络和鲁棒自适应拍卖算法的快速任务分配策略。为提高燃料消耗指标的计算效率,利用深度神经网络直接预测连续推力转移轨迹的燃料消耗,避免在线规划相对运动轨迹。通过构造虚拟收益矩阵和分配向量使得拍卖算法适用于航天器数与任务数目不一致的分配问题。为提高拍卖算法的收敛速度,提出报价增量自适应调整策略。考虑到通信失联、航天器故障等不确定因素,通过在线调整故障航天器的收益和报价矩阵以提高算法鲁棒性。数值仿真表明深度神经网络对燃料消耗指标预测精度高,基于深度神经网络和鲁棒自适应拍卖算法的快速任务分配策略可在保持计算精度的同时,将计算效率提升约两个数量级。  相似文献   

13.
针对近地共面圆轨道上的两飞行器追逃问题,应用定性微分对策理论,在双方均为连续小推力假设下,研究了在视线坐标系下对策双方在中立结局上的最优控制策略及中立结局的非线性界栅构造及线性界栅的求解方法。在线性化方法中,首先针对方程中的状态变量作线性化,待最优推力确定后,再对推力变量在确定的终端附近线性化。本文理论推导最终得到了最优推力及线性化界栅表达式,给出线性化界栅与非线性数值逼近解的仿真结果。  相似文献   

14.
针对多星博弈拦截问题,基于微分博弈对策研究了各航天器的博弈策略。分别讨论了多颗拦截器的非合作Nash反馈策略,以及合作Pareto反馈策略。首先针对Nash均衡,各拦截器以终端零控脱靶量为指标设计了博弈策略,而目标的策略以终端脱靶量的加权和进行设计。进一步,考虑各拦截器采取合作方式进行拦截,相应的博弈策略基于单一指标的凸组合进行设计,而目标的策略保持不变。通过比较,Nash反馈策略与Pareto反馈策略相同,使得拦截器可以采取非合作模式实现合作拦截的目的。最后仿真分析了2颗拦截器对同一目标进行拦截的博弈态势,表明了本文提出的博弈策略对多星博弈问题的有效性。  相似文献   

15.
航天器铷钟的一种精密控温系统   总被引:4,自引:2,他引:2  
研究了一种应用于航天器的高精度、高稳定度的温度控制系统:使用热敏电阻作为温度传感器;采用多级控温策略,核心级采用基于径向基函数(Radial Basis Function,RBF)神经网络比例、积分、微分(PID)控制算法,非核心级采用积分分离式PID算法;采用脉宽调制(PWM)控制作为控制方式。以航天器铷钟作为控制对...  相似文献   

16.
针对强化学习策略由仿真环境向实际迁移困难的问题,以提高无人机采用无深度信息单目视觉时的行人规避能力为目标,提出一种基于异步深度神经网络结构的跨传感器迁移学习方法。首先,在仿真环境中仅使用虚拟单线激光雷达作为传感器,通过基于确定性策略梯度(DDPG)的深度强化学习方法,训练得到一个稳定的初级避障策略。其次,用单目摄像头和激光雷达同步采集现实环境中的视觉和深度数据集并逐帧绑定,使用上述初级避障策略对现实数据集进行自动标注,进而训练得到无需激光雷达数据的单目视觉避障策略,实现从虚拟激光雷达到现实单目视觉的跨传感器迁移学习。最后,引入YOLO v3-tiny网络与Resnet18网络组成异步深度神经网络结构,有效提高了存在行人场景下的避障性能。  相似文献   

17.
本文针对柔性航天器在惯性参数未知、外界干扰、输入饱和等复杂条件下的姿态控制问题,提出了1种基于神经网络干扰观测器的柔性航天器姿态稳定控制方法。首先,基于包含压电振动抑制输入的柔性航天器姿态动力学模型,构建了包含外界干扰、惯性参数不确定性的综合扰动项;其次,基于RBF神经网络设计干扰观测器与自适应参数调节律实时地估计综合扰动;再次,设计了1种固定时间收敛且有限时间稳定的非线性滑模控制器,并通过Lyapunov理论进行了稳定性分析;最后,利用航天器闭环姿态动力学系统进行数值仿真。结果表明:所设计的基于神经网络干扰观测器的控制方法可以有效实现航天器的姿态稳定、振动抑制与干扰估计,从而顺利完成航天器的高精高稳控制任务。  相似文献   

18.
康国华  金晨迪  郭玉洁  乔思元 《宇航学报》2019,40(11):1322-1331
利用模型预测算法先预测控制结果后控制的类人行为特点,借助深度学习在多参数寻优上的优势,提出了一种基于卷积神经网络的模型预测控制算法,满足航天工程低硬件需求,实现组合航天器多场景下姿态控制律的重构。该算法首先利用模型预测控制将组合航天器从初始状态控制到预期状态,然后将控制过程中状态量用于3层3核卷积神经网络的训练,训练完成后,用该卷积神经网络代替模型预测对组合航天器进行控制,从而降低计算资源需求。仿真校验表明:该算法可预测5个控制周期内的控制参数,相比传统模型预测算法所需硬件计算时间降低约5倍,在一般硬件环境下30 s内即可完成各场景下的组合航天器姿态控制,控制精度在10 -4 量级。  相似文献   

19.
自适应波束形成技术是航天领域中的旁瓣抗干扰关键技术之一。当回波数据量增多时,传统的波束形成算法无法进行快速的处理,而应用深度神经网络模型对数据进行预训练可以快速的进行波束形成,因此根据波束形成原理利用分段训练方式设计深度神经网络,应用Leaky-ReLU激活函数、Adam优化算法和Dropout正则化方法提升深度神经网络的性能,提出了基于深度神经网络的自适应波束形成算法。仿真结果表明,相比于传统的LMS算法,在实验环境下,基于深度神经网络的自适应波束形成算法的计算速度约有7~8倍的提高。  相似文献   

20.
裴培  何绍溟  王江  林德福 《宇航学报》2021,42(10):1293-1304
研究了一种基于深度强化学习理论的制导控制一体化算法。不同于传统的制导控制一体化算法和制导控制回路分开设计的方法,基于深度强化学习理论的制导控制一体化算法利用深度学习强化算法生成一个智能体,智能体根据导弹的观测量生成舵偏角控制指令准确拦截目标。首先将制导控制问题转化为一个马尔可夫决策过程,然后提出了一个权衡制导精度、能量损耗和飞行时间的奖励函数,将制导控制问题转化到强化学习问题的框架中。最后采用深度确定性策略梯度算法,求解提出的强化学习问题,训练得到制导控制智能体,智能体根据导弹观测量生成舵偏角指令。通过进行大量的数值模拟,验证了提出的制导控制一体化算法的有效性和鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号