共查询到20条相似文献,搜索用时 31 毫秒
1.
针对时间固定的两航天器追逃问题,提出一种以半直接配点法研究追逃双方最优控制策略的求解方法。航天器追逃问题是基于微分对策的追逃问题,该问题是含有追逐者和逃逸者控制变量的两点边值问题。若采用必要条件求解,则对迭代初值要求高,收敛困难。在两航天器均为连续小推力的假设条件下,以终端距离为支付函数,给出半直接配点法的求解过程。在此数值方法中,根据半直接转换将微分对策问题转化为最优控制问题,采用Gauss-Lobbato配点法将此最优问题最终转化为非线性规划问题,继而通过序列二次规划算法求解。这种半直接配点法避免了对微分对策问题最优策略的必要条件(两点边值问题)求解。采用该方法求解对迭代初值不敏感,且数值稳定性好。数值仿真实例验证了这种求解方法的可行性。该方法提高了求解两点边值问题的收敛性,为求解含有双方控制变量的微分对策问题提供了一种思路。 相似文献
2.
采用半直接配点法求解时间固定两航天器追逃问题,提出一种新的数值求解追逃双方最优控制策略的方式,避免了求解非线性两点边值问题。在两航天器均为连续小推力假设条件下,以终端距离为支付函数,给出了半直接配点法求解此追逃问题的过程。在此数值方法中,根据半直接转换将微分对策问题转化为一个最优控制问题,由Gauss-Lobbato配点法最终将此最优问题转化为非线性规划问题,继而通过序列二次规划方法求解。这种半直接配点法避免微分对策问题最优策略的必要条件(两点边值问题)求解,并且数值稳定性好。数值仿真给出了追逃双发的最优控制策略和相应的追逃轨迹。 相似文献
3.
针对航天器轨道追逃博弈问题,提出一种多阶段学习训练赋能方法,使得追踪星在终端时刻抵近逃逸星的特定区域,而逃逸星需要通过轨道机动规避追踪星。首先,构建两星的训练策略集,基于逻辑规则设计追踪星和逃逸星的机动策略,通过实时预测对方的终端位置,设计己方的期望位置和脉冲策略,显式给出追逃策略的解析表达式,用于训练赋能;其次,为提升航天器的训练赋能效率及应对未知环境的博弈能力,提出一种基于强化学习技术多模式、分阶段的学习训练方法,先使追踪星和逃逸星分别应对上述逻辑规则引导下的逃逸星和追踪星,完成预训练;再次,开展二次训练,两星都采用邻近策略优化(PPO)策略进行追逃博弈,在博弈中不断调整网络权值,提升决策能力;最后,在仿真环境中验证提出的训练方法的有效性,经过二次训练后,追踪星和逃逸星可有效应对不同策略驱动下的对手,提升追逃成功率。 相似文献
4.
针对不完全信息下的航天器末端追逃问题,提出了一种满足Epsilon纳什均衡的微分博弈控制策略。首先,建立了完全信息下的有限时间追逃纳什均衡策略对,并将其作为目标航天器实际采取的控制策略,使目标航天器掌握博弈进程的完全信息,进而获得更好的逃逸性能。在此基础上,考虑拦截航天器不能获取目标控制矩阵信息的态势,设计了基于广义卡尔曼滤波的行为学习信息估计算法,使拦截器能够对目标的不完全信息进行估计,并提出了不完全信息下的末端追逃博弈控制策略。经过理论分析,证明了所设计的不完全信息下微分博弈策略对满足Epsilon纳什均衡。最后,仿真结果表明该算法可以有效估计目标的不完全信息,确保拦截器能够在有限时间内快速拦截目标。 相似文献
5.
6.
本文研究了地球高阶引力模型中,基于脉冲作用的航天器轨道追逃问题。针对该问题,将航天器轨道追逃问题定义为两选手计算博弈,其中以博弈双方的距离和燃料消耗设计了性能指标函数,并以速度增量大小和方向构建容许控制集。此外,为了保证纳什均衡解的求解效率,引入了快速搜索(ARS)算法,并设计了一种数据剪枝方法用于优化搜索空间,最终实现了基于计算博弈的控制策略的快速求解。仿真结果表明:该方法能够有效解决脉冲作用下航天器的追逃难题,与传统方法相比,该方法能同时满足脱靶量精度和燃料消耗要求,具有一定的可行性和有效性。 相似文献
7.
8.
针对燃料耗尽的失效航天器姿态接管控制问题,提出多颗微卫星协同实现姿态稳定的状态相关黎卡提方程(SDRE)微分博弈控制方法。首先,将姿态接管问题转化为多颗微卫星的微分博弈问题,基于组合航天器的姿态模型和微卫星的性能指标函数建立多颗微卫星的非线性微分博弈模型,微卫星通过独立优化各自的性能指标函数得到控制策略。其次,引入状态相关系数矩阵,将非线性博弈转化为状态相关线性二次型博弈,采用SDRE方法更方便地逼近微卫星的博弈均衡策略。最终通过李雅普诺夫迭代法求解耦合状态相关黎卡提方程组得到微卫星的状态反馈控制器,实现微卫星的自主决策。数值仿真验证了多颗微卫星采用微分博弈控制方法实现姿态接管的有效性和容错性。 相似文献
9.
针对信息非完备约束下航天器轨道博弈难以自主决策的问题,基于多智能体强化学习提出一种多航天器轨道博弈决策方法。首先建立轨道博弈动力学和信息非完备约束。其次建立用于训练和决策的神经网络模型,依据分布式系统架构对网络的输入输出结构进行设计,并引入具有记忆功能的长短期记忆网络(LSTM),根据航天器轨道运动在时间、空间连续的属性,补偿位置、速度测量信息的非完备性。然后采用近端策略优化(PPO)算法开展红蓝左右互搏式学习训练。最后通过三组对比训练实验,验证了所提出的方法在信息非完备约束下能够有效增强学习训练过程的稳定性,并提升任务完成率和降低燃料消耗。 相似文献
10.
11.
针对航天器末端拦截博弈问题,基于微分对策理论研究了各星的博弈策略。根据拦截空间是否具有防御器将博弈态势分为双星博弈和三星博弈。首先考虑拦截器与目标的双星博弈态势,以终端脱靶量为指标设计了相对博弈策略,并提出时间分析方程以提高策略对不同拦截态势的自适应性。然后,考虑具有防御器的三星博弈态势,提出了博弈切换策略将其化为分段双星博弈,并将双边时间方程扩展到三星博弈中,使拦截器在不被防御器反拦截的情况下,实现对目标的快速拦截。最后仿真分析了博弈策略与时间分析方程对航天器拦截博弈问题的有效性。 相似文献
12.
针对集群航天器协同观测任务分配问题,提出一种基于深度神经网络和鲁棒自适应拍卖算法的快速任务分配策略。为提高燃料消耗指标的计算效率,利用深度神经网络直接预测连续推力转移轨迹的燃料消耗,避免在线规划相对运动轨迹。通过构造虚拟收益矩阵和分配向量使得拍卖算法适用于航天器数与任务数目不一致的分配问题。为提高拍卖算法的收敛速度,提出报价增量自适应调整策略。考虑到通信失联、航天器故障等不确定因素,通过在线调整故障航天器的收益和报价矩阵以提高算法鲁棒性。数值仿真表明深度神经网络对燃料消耗指标预测精度高,基于深度神经网络和鲁棒自适应拍卖算法的快速任务分配策略可在保持计算精度的同时,将计算效率提升约两个数量级。 相似文献
13.
14.
针对多星博弈拦截问题,基于微分博弈对策研究了各航天器的博弈策略。分别讨论了多颗拦截器的非合作Nash反馈策略,以及合作Pareto反馈策略。首先针对Nash均衡,各拦截器以终端零控脱靶量为指标设计了博弈策略,而目标的策略以终端脱靶量的加权和进行设计。进一步,考虑各拦截器采取合作方式进行拦截,相应的博弈策略基于单一指标的凸组合进行设计,而目标的策略保持不变。通过比较,Nash反馈策略与Pareto反馈策略相同,使得拦截器可以采取非合作模式实现合作拦截的目的。最后仿真分析了2颗拦截器对同一目标进行拦截的博弈态势,表明了本文提出的博弈策略对多星博弈问题的有效性。 相似文献
15.
16.
针对高速机动飞行器常用的程序化机动突防方式适应性不强、突防效果不稳定的问题,提出了一种基于深度强化学习算法的机动博弈制导方法。该方法以增大交会摆脱量为任务目标,采用深度神经网络拟合飞行器的制导律,应用强化学习方法训练网络参数,得到一种以突防拦截双方的位置和速度为输入、以飞行器的需用过载为输出的智能机动博弈制导律。数学仿真验证结果表明,在连续的状态空间和动作空间中,飞行器能根据当前态势自主选择合适的制导指令。相比传统突防方式,该制导律显著提升了交会摆脱量,且突防效果更稳定。 相似文献
17.
本文针对柔性航天器在惯性参数未知、外界干扰、输入饱和等复杂条件下的姿态控制问题,提出了1种基于神经网络干扰观测器的柔性航天器姿态稳定控制方法。首先,基于包含压电振动抑制输入的柔性航天器姿态动力学模型,构建了包含外界干扰、惯性参数不确定性的综合扰动项;其次,基于RBF神经网络设计干扰观测器与自适应参数调节律实时地估计综合扰动;再次,设计了1种固定时间收敛且有限时间稳定的非线性滑模控制器,并通过Lyapunov理论进行了稳定性分析;最后,利用航天器闭环姿态动力学系统进行数值仿真。结果表明:所设计的基于神经网络干扰观测器的控制方法可以有效实现航天器的姿态稳定、振动抑制与干扰估计,从而顺利完成航天器的高精高稳控制任务。 相似文献
18.
利用模型预测算法先预测控制结果后控制的类人行为特点,借助深度学习在多参数寻优上的优势,提出了一种基于卷积神经网络的模型预测控制算法,满足航天工程低硬件需求,实现组合航天器多场景下姿态控制律的重构。该算法首先利用模型预测控制将组合航天器从初始状态控制到预期状态,然后将控制过程中状态量用于3层3核卷积神经网络的训练,训练完成后,用该卷积神经网络代替模型预测对组合航天器进行控制,从而降低计算资源需求。仿真校验表明:该算法可预测5个控制周期内的控制参数,相比传统模型预测算法所需硬件计算时间降低约5倍,在一般硬件环境下30 s内即可完成各场景下的组合航天器姿态控制,控制精度在10 -4 量级。 相似文献
19.
20.
柏沫羽刘昊陈浩川张振华 《遥测遥控》2019,(6):28-36
自适应波束形成技术是航天领域中的旁瓣抗干扰关键技术之一。当回波数据量增多时,传统的波束形成算法无法进行快速的处理,而应用深度神经网络模型对数据进行预训练可以快速的进行波束形成,因此根据波束形成原理利用分段训练方式设计深度神经网络,应用Leaky-ReLU激活函数、Adam优化算法和Dropout正则化方法提升深度神经网络的性能,提出了基于深度神经网络的自适应波束形成算法。仿真结果表明,相比于传统的LMS算法,在实验环境下,基于深度神经网络的自适应波束形成算法的计算速度约有7~8倍的提高。 相似文献