期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

孙松涛祝强军宋斌《上海航天》2019,36(3):68-74

针对时间固定的两航天器追逃问题,提出一种以半直接配点法研究追逃双方最优控制策略的求解方法。航天器追逃问题是基于微分对策的追逃问题,该问题是含有追逐者和逃逸者控制变量的两点边值问题。若采用必要条件求解,则对迭代初值要求高,收敛困难。在两航天器均为连续小推力的假设条件下,以终端距离为支付函数,给出半直接配点法的求解过程。在此数值方法中,根据半直接转换将微分对策问题转化为最优控制问题,采用Gauss-Lobbato配点法将此最优问题最终转化为非线性规划问题,继而通过序列二次规划算法求解。这种半直接配点法避免了对微分对策问题最优策略的必要条件(两点边值问题)求解。采用该方法求解对迭代初值不敏感,且数值稳定性好。数值仿真实例验证了这种求解方法的可行性。该方法提高了求解两点边值问题的收敛性,为求解含有双方控制变量的微分对策问题提供了一种思路。相似文献

2.

半直接配点法在航天器追逃问题求解中的应用

下载免费PDF全文

郝志伟孙松涛张秋华谌颖《宇航学报》2019,40(6):628-635

采用半直接配点法求解时间固定两航天器追逃问题,提出一种新的数值求解追逃双方最优控制策略的方式,避免了求解非线性两点边值问题。在两航天器均为连续小推力假设条件下,以终端距离为支付函数,给出了半直接配点法求解此追逃问题的过程。在此数值方法中,根据半直接转换将微分对策问题转化为一个最优控制问题,由Gauss-Lobbato配点法最终将此最优问题转化为非线性规划问题,继而通过序列二次规划方法求解。这种半直接配点法避免微分对策问题最优策略的必要条件(两点边值问题)求解,并且数值稳定性好。数值仿真给出了追逃双发的最优控制策略和相应的追逃轨迹。相似文献

3.

航天器轨道追逃博弈多阶段强化学习训练方法

下载免费PDF全文

袁利耿远卓汤亮黄煌《上海航天》2022,39(4):33-41

针对航天器轨道追逃博弈问题,提出一种多阶段学习训练赋能方法,使得追踪星在终端时刻抵近逃逸星的特定区域,而逃逸星需要通过轨道机动规避追踪星。首先,构建两星的训练策略集,基于逻辑规则设计追踪星和逃逸星的机动策略,通过实时预测对方的终端位置,设计己方的期望位置和脉冲策略,显式给出追逃策略的解析表达式,用于训练赋能;其次,为提升航天器的训练赋能效率及应对未知环境的博弈能力,提出一种基于强化学习技术多模式、分阶段的学习训练方法,先使追踪星和逃逸星分别应对上述逻辑规则引导下的逃逸星和追踪星,完成预训练;再次,开展二次训练,两星都采用邻近策略优化(PPO)策略进行追逃博弈,在博弈中不断调整网络权值,提升决策能力;最后,在仿真环境中验证提出的训练方法的有效性,经过二次训练后,追踪星和逃逸星可有效应对不同策略驱动下的对手,提升追逃成功率。相似文献

4.

不完全信息Epsilon纳什均衡的航天器末端追逃博弈策略

汤旭叶东肖岩孙兆伟《宇航学报》2024,(1):63-73

针对不完全信息下的航天器末端追逃问题,提出了一种满足Epsilon纳什均衡的微分博弈控制策略。首先,建立了完全信息下的有限时间追逃纳什均衡策略对,并将其作为目标航天器实际采取的控制策略,使目标航天器掌握博弈进程的完全信息,进而获得更好的逃逸性能。在此基础上,考虑拦截航天器不能获取目标控制矩阵信息的态势,设计了基于广义卡尔曼滤波的行为学习信息估计算法,使拦截器能够对目标的不完全信息进行估计,并提出了不完全信息下的末端追逃博弈控制策略。经过理论分析,证明了所设计的不完全信息下微分博弈策略对满足Epsilon纳什均衡。最后,仿真结果表明该算法可以有效估计目标的不完全信息,确保拦截器能够在有限时间内快速拦截目标。相似文献

5.

机动目标的空间交会微分对策制导方法 总被引：1，自引：0，他引：1

下载免费PDF全文

常燕陈韵鲜勇雷刚《宇航学报》2016,37(7):795-801

针对目标机动情况,利用定量微分对策方法分析连续推力作用下的空间交会追逃微分对问题,提出用非线性规划求解该微分对策问题的方法,建立空间交会追逃微分对策的非线性规划模型,有效解决了机动目标空间交会微分对策模型高度非线性且难于利用经典最优控制理论进行求解的问题,实现了最优控制与对策论的结合,并通过数值仿真校验了该方法的有效性。相似文献

6.

基于计算博弈的脉冲作用下航天器追逃策略

下载免费PDF全文

顾天妍张永合蒋峻李超勇《上海航天》2023,40(4):80-87

本文研究了地球高阶引力模型中,基于脉冲作用的航天器轨道追逃问题。针对该问题,将航天器轨道追逃问题定义为两选手计算博弈,其中以博弈双方的距离和燃料消耗设计了性能指标函数,并以速度增量大小和方向构建容许控制集。此外,为了保证纳什均衡解的求解效率,引入了快速搜索(ARS)算法,并设计了一种数据剪枝方法用于优化搜索空间,最终实现了基于计算博弈的控制策略的快速求解。仿真结果表明:该方法能够有效解决脉冲作用下航天器的追逃难题,与传统方法相比,该方法能同时满足脱靶量精度和燃料消耗要求,具有一定的可行性和有效性。相似文献

7.

基于追逃博弈的非合作目标接近控制 总被引：1，自引：0，他引：1

下载免费PDF全文

柴源罗建军王明明韩楠《宇航总体技术》2020,4(1):30-38

针对追踪航天器接近非合作目标任务中的相对位置控制问题,提出了一种基于线性二次型追逃博弈的控制方法。首先,将非合作目标接近问题转化为二人追逃博弈问题,并设计了二次型目标函数。其次,结合相对运动模型,建立了线性二次型追逃博弈模型。为得到纳什均衡策略,将HJ方程转化为代数黎卡提方程,并给出了李雅普诺夫迭代法对其求解。最后,对博弈控制方法的有效性进行仿真验证,结果表明,该方法能够在非合作目标机动时实现轨道接近控制。相似文献

8.

失效航天器姿态接管的SDRE微分博弈控制

下载免费PDF全文

柴源罗建军韩楠谢剑锋《宇航学报》2020,41(2):191-198

针对燃料耗尽的失效航天器姿态接管控制问题,提出多颗微卫星协同实现姿态稳定的状态相关黎卡提方程(SDRE)微分博弈控制方法。首先,将姿态接管问题转化为多颗微卫星的微分博弈问题,基于组合航天器的姿态模型和微卫星的性能指标函数建立多颗微卫星的非线性微分博弈模型,微卫星通过独立优化各自的性能指标函数得到控制策略。其次,引入状态相关系数矩阵,将非线性博弈转化为状态相关线性二次型博弈,采用SDRE方法更方便地逼近微卫星的博弈均衡策略。最终通过李雅普诺夫迭代法求解耦合状态相关黎卡提方程组得到微卫星的状态反馈控制器,实现微卫星的自主决策。数值仿真验证了多颗微卫星采用微分博弈控制方法实现姿态接管的有效性和容错性。相似文献

9.

信息非完备下多航天器轨道博弈强化学习方法

下载免费PDF全文

王英杰袁利汤亮黄煌耿远卓《宇航学报》2023,(10):1522-1533

针对信息非完备约束下航天器轨道博弈难以自主决策的问题，基于多智能体强化学习提出一种多航天器轨道博弈决策方法。首先建立轨道博弈动力学和信息非完备约束。其次建立用于训练和决策的神经网络模型，依据分布式系统架构对网络的输入输出结构进行设计，并引入具有记忆功能的长短期记忆网络(LSTM),根据航天器轨道运动在时间、空间连续的属性，补偿位置、速度测量信息的非完备性。然后采用近端策略优化(PPO)算法开展红蓝左右互搏式学习训练。最后通过三组对比训练实验，验证了所提出的方法在信息非完备约束下能够有效增强学习训练过程的稳定性，并提升任务完成率和降低燃料消耗。相似文献

10.

基于多智能体强化学习的轨道追逃博弈方法 总被引：1，自引：0，他引：1

下载免费PDF全文

许旭升党朝辉宋斌袁秋帆肖余之《上海航天》2022,39(2):24-31

针对空间轨道博弈过程中的集群卫星和非合作目标追逃博弈情形下的动力学模型复杂、非合作目标机动信息未知,以及卫星间难以有效协调等问题,提出一种基于多智能体深度强化学习算法的集群卫星空间轨道追逃博弈方法.首先通过对博弈场景进行建模,在考虑最短时间、最优燃料以及碰撞规避的情形下进行奖励函数的塑造和改进,利用深度强化学习方法中的... 相似文献

11.

航天器末端拦截自适应博弈策略

下载免费PDF全文

王淳宝叶东孙兆伟孙楚琦《宇航学报》2020,41(3):309-318

针对航天器末端拦截博弈问题,基于微分对策理论研究了各星的博弈策略。根据拦截空间是否具有防御器将博弈态势分为双星博弈和三星博弈。首先考虑拦截器与目标的双星博弈态势,以终端脱靶量为指标设计了相对博弈策略,并提出时间分析方程以提高策略对不同拦截态势的自适应性。然后,考虑具有防御器的三星博弈态势,提出了博弈切换策略将其化为分段双星博弈,并将双边时间方程扩展到三星博弈中,使拦截器在不被防御器反拦截的情况下,实现对目标的快速拦截。最后仿真分析了博弈策略与时间分析方程对航天器拦截博弈问题的有效性。相似文献

12.

集群航天器鲁棒自适应快速任务分配

下载免费PDF全文

张润德蔡伟伟杨乐平范大伟《宇航学报》2023,(8):1183-1194

针对集群航天器协同观测任务分配问题，提出一种基于深度神经网络和鲁棒自适应拍卖算法的快速任务分配策略。为提高燃料消耗指标的计算效率，利用深度神经网络直接预测连续推力转移轨迹的燃料消耗，避免在线规划相对运动轨迹。通过构造虚拟收益矩阵和分配向量使得拍卖算法适用于航天器数与任务数目不一致的分配问题。为提高拍卖算法的收敛速度，提出报价增量自适应调整策略。考虑到通信失联、航天器故障等不确定因素，通过在线调整故障航天器的收益和报价矩阵以提高算法鲁棒性。数值仿真表明深度神经网络对燃料消耗指标预测精度高，基于深度神经网络和鲁棒自适应拍卖算法的快速任务分配策略可在保持计算精度的同时，将计算效率提升约两个数量级。相似文献

13.

空间飞行器在视线坐标系中的追逃界栅

张秋华赵小津孙毅《航天控制》2007,25(1):26-30

针对近地共面圆轨道上的两飞行器追逃问题,应用定性微分对策理论,在双方均为连续小推力假设下,研究了在视线坐标系下对策双方在中立结局上的最优控制策略及中立结局的非线性界栅构造及线性界栅的求解方法。在线性化方法中,首先针对方程中的状态变量作线性化,待最优推力确定后,再对推力变量在确定的终端附近线性化。本文理论推导最终得到了最优推力及线性化界栅表达式,给出线性化界栅与非线性数值逼近解的仿真结果。相似文献

14.

多星博弈拦截Nash和Pareto策略研究

徐东宇王淳宝赵硕叶东《航天控制》2019,37(4):41-46

针对多星博弈拦截问题,基于微分博弈对策研究了各航天器的博弈策略。分别讨论了多颗拦截器的非合作Nash反馈策略,以及合作Pareto反馈策略。首先针对Nash均衡,各拦截器以终端零控脱靶量为指标设计了博弈策略,而目标的策略以终端脱靶量的加权和进行设计。进一步,考虑各拦截器采取合作方式进行拦截,相应的博弈策略基于单一指标的凸组合进行设计,而目标的策略保持不变。通过比较,Nash反馈策略与Pareto反馈策略相同,使得拦截器可以采取非合作模式实现合作拦截的目的。最后仿真分析了2颗拦截器对同一目标进行拦截的博弈态势,表明了本文提出的博弈策略对多星博弈问题的有效性。相似文献

15.

航天器铷钟的一种精密控温系统 总被引：2，自引：2，他引：2

李国强耿利寅童叶龙《航天器工程》2011,20(4):93-98

研究了一种应用于航天器的高精度、高稳定度的温度控制系统：使用热敏电阻作为温度传感器;采用多级控温策略,核心级采用基于径向基函数（Radial Basis Function,RBF）神经网络比例、积分、微分（PID）控制算法,非核心级采用积分分离式PID算法;采用脉宽调制（PWM）控制作为控制方式。以航天器铷钟作为控制对... 相似文献

16.

一种基于深度强化学习的机动博弈制导律设计方法

朱雅萌张海瑞周国峰梁卓吕瑞《航天控制》2022,(3):28-36

针对高速机动飞行器常用的程序化机动突防方式适应性不强、突防效果不稳定的问题,提出了一种基于深度强化学习算法的机动博弈制导方法。该方法以增大交会摆脱量为任务目标,采用深度神经网络拟合飞行器的制导律,应用强化学习方法训练网络参数,得到一种以突防拦截双方的位置和速度为输入、以飞行器的需用过载为输出的智能机动博弈制导律。数学仿真验证结果表明,在连续的状态空间和动作空间中,飞行器能根据当前态势自主选择合适的制导指令。相比传统突防方式,该制导律显著提升了交会摆脱量,且突防效果更稳定。相似文献

17.

基于神经网络干扰观测器的柔性航天器姿态稳定控制

下载免费PDF全文

岳晓奎吕佰梁刘闯韩豪泽《上海航天》2022,39(4):58-65

本文针对柔性航天器在惯性参数未知、外界干扰、输入饱和等复杂条件下的姿态控制问题,提出了1种基于神经网络干扰观测器的柔性航天器姿态稳定控制方法。首先,基于包含压电振动抑制输入的柔性航天器姿态动力学模型,构建了包含外界干扰、惯性参数不确定性的综合扰动项;其次,基于RBF神经网络设计干扰观测器与自适应参数调节律实时地估计综合扰动;再次,设计了1种固定时间收敛且有限时间稳定的非线性滑模控制器,并通过Lyapunov理论进行了稳定性分析;最后,利用航天器闭环姿态动力学系统进行数值仿真。结果表明:所设计的基于神经网络干扰观测器的控制方法可以有效实现航天器的姿态稳定、振动抑制与干扰估计,从而顺利完成航天器的高精高稳控制任务。相似文献

18.

基于深度学习的组合体航天器模型预测控制

下载免费PDF全文

康国华金晨迪郭玉洁乔思元《宇航学报》2019,40(11):1322-1331

利用模型预测算法先预测控制结果后控制的类人行为特点,借助深度学习在多参数寻优上的优势,提出了一种基于卷积神经网络的模型预测控制算法,满足航天工程低硬件需求,实现组合航天器多场景下姿态控制律的重构。该算法首先利用模型预测控制将组合航天器从初始状态控制到预期状态,然后将控制过程中状态量用于3层3核卷积神经网络的训练,训练完成后,用该卷积神经网络代替模型预测对组合航天器进行控制,从而降低计算资源需求。仿真校验表明：该算法可预测5个控制周期内的控制参数,相比传统模型预测算法所需硬件计算时间降低约5倍,在一般硬件环境下30 s内即可完成各场景下的组合航天器姿态控制,控制精度在10 -4 量级。相似文献

19.

星地协同光学遥感影像目标识别技术验证研究 总被引：1，自引：0，他引：1

薛武赵玲王鹏《航天返回与遥感》2021,42(3):128-137

为了提高光学遥感卫星信息处理的时效性,文章提出了星地协同光学遥感影像在轨目标智能识别技术框架.将基于遥感大数据的深度学习、神经网络模型训练等数据量大、运算量大、计算复杂、要求较高的处理任务部署在地面服务器,将深度学习训练得到的模型进行压缩并上注至卫星,卫星在轨利用轻量化模型对影像进行推理计算,最后把目标识别结果下传至用... 相似文献

20.

基于深度神经网络的自适应波束形成算法

柏沫羽刘昊陈浩川张振华《遥测遥控》2019,(6):28-36

自适应波束形成技术是航天领域中的旁瓣抗干扰关键技术之一。当回波数据量增多时,传统的波束形成算法无法进行快速的处理,而应用深度神经网络模型对数据进行预训练可以快速的进行波束形成,因此根据波束形成原理利用分段训练方式设计深度神经网络,应用Leaky-ReLU激活函数、Adam优化算法和Dropout正则化方法提升深度神经网络的性能,提出了基于深度神经网络的自适应波束形成算法。仿真结果表明,相比于传统的LMS算法,在实验环境下,基于深度神经网络的自适应波束形成算法的计算速度约有7~8倍的提高。相似文献