首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
基于追逃博弈的非合作目标接近控制   总被引:1,自引:0,他引:1       下载免费PDF全文
针对追踪航天器接近非合作目标任务中的相对位置控制问题,提出了一种基于线性二次型追逃博弈的控制方法。首先,将非合作目标接近问题转化为二人追逃博弈问题,并设计了二次型目标函数。其次,结合相对运动模型,建立了线性二次型追逃博弈模型。为得到纳什均衡策略,将HJ方程转化为代数黎卡提方程,并给出了李雅普诺夫迭代法对其求解。最后,对博弈控制方法的有效性进行仿真验证,结果表明,该方法能够在非合作目标机动时实现轨道接近控制。  相似文献   

2.
王英杰  袁利  汤亮  黄煌  耿远卓 《宇航学报》2023,(10):1522-1533
针对信息非完备约束下航天器轨道博弈难以自主决策的问题,基于多智能体强化学习提出一种多航天器轨道博弈决策方法。首先建立轨道博弈动力学和信息非完备约束。其次建立用于训练和决策的神经网络模型,依据分布式系统架构对网络的输入输出结构进行设计,并引入具有记忆功能的长短期记忆网络(LSTM),根据航天器轨道运动在时间、空间连续的属性,补偿位置、速度测量信息的非完备性。然后采用近端策略优化(PPO)算法开展红蓝左右互搏式学习训练。最后通过三组对比训练实验,验证了所提出的方法在信息非完备约束下能够有效增强学习训练过程的稳定性,并提升任务完成率和降低燃料消耗。  相似文献   

3.
吴其昌  李彬  李君  张洪波 《航天控制》2019,37(6):13-18,58
航天器追逃博弈是当前航天领域的一个研究热点,传统上多采用微分对策来获取追逃双方的最优控制策略,但是方法求解复杂、计算量大,难以满足复杂任务和对抗类任务的实时性要求。随着机器学习技术的发展,利用深度神经网络结构实现全部或部分的在线决策成为可能,因此研究了基于深度神经网络生成无限时域型追逃博弈最优控制策略问题。首先基于CW方程建立追逃博弈相对运动模型,采用微分对策理论得到追逃最优控制策略,得到训练数据集和测试数据集;基于TensorFlow环境搭建了4层神经网络,采用Adam优化算法对网络进行训练。仿真结果表明,经过训练的深度神经网络生成的控制策略与传统方法的策略基本一致,虽然长时间追逃的控制差异逐渐增大,但变化趋势相同,说明利用深度神经网络生成航天器追逃博弈的机动策略是有效的。  相似文献   

4.
针对不完全信息下的航天器末端追逃问题,提出了一种满足Epsilon纳什均衡的微分博弈控制策略。首先,建立了完全信息下的有限时间追逃纳什均衡策略对,并将其作为目标航天器实际采取的控制策略,使目标航天器掌握博弈进程的完全信息,进而获得更好的逃逸性能。在此基础上,考虑拦截航天器不能获取目标控制矩阵信息的态势,设计了基于广义卡尔曼滤波的行为学习信息估计算法,使拦截器能够对目标的不完全信息进行估计,并提出了不完全信息下的末端追逃博弈控制策略。经过理论分析,证明了所设计的不完全信息下微分博弈策略对满足Epsilon纳什均衡。最后,仿真结果表明该算法可以有效估计目标的不完全信息,确保拦截器能够在有限时间内快速拦截目标。  相似文献   

5.
本文研究了地球高阶引力模型中,基于脉冲作用的航天器轨道追逃问题。针对该问题,将航天器轨道追逃问题定义为两选手计算博弈,其中以博弈双方的距离和燃料消耗设计了性能指标函数,并以速度增量大小和方向构建容许控制集。此外,为了保证纳什均衡解的求解效率,引入了快速搜索(ARS)算法,并设计了一种数据剪枝方法用于优化搜索空间,最终实现了基于计算博弈的控制策略的快速求解。仿真结果表明:该方法能够有效解决脉冲作用下航天器的追逃难题,与传统方法相比,该方法能同时满足脱靶量精度和燃料消耗要求,具有一定的可行性和有效性。  相似文献   

6.
王威  付晓锋  郗晓宁 《宇航学报》2007,28(3):663-666
文献[1,2]已研究了单航天器无需变轨对Walker星座多星交会的轨道设计,在此基础上,依据交会点必是轨道交点的轨道特性,提出了轨道全解的解析法,可给出该轨道所能够交会卫星的最大数目,研究结果可为单航天器无需大机动变轨对星座多星接近的轨道应用提供理论参考。  相似文献   

7.
提出一种航天器反应式碎片规避动作规划方法,首先以扰动流体动态系统(IFDS)算法作为动作规划的基础算法,通过其中的总和扰动矩阵对航天器的轨道速度矢量进行修正,实现轨道机动规避;然后,建立基于双延迟深度确定性策略梯度(TD3)深度强化学习算法的反应式动作规划方法,通过TD3在线优化IFDS规划参数,实现对碎片群的“状态-动作”最优、快速规避决策。在此基础上,将优先级经验回放和渐进式学习策略引入该方法中,提升训练效率。最后,仿真结果表明,所提方法可使航天器安全规避多发、突发、动态且形状各异的空间碎片群,且具有较好的实时性。  相似文献   

8.
徐根  刘幸川  陈丹鹤  廖文和 《宇航学报》2022,43(11):1533-1543
针对立方星轨道机动能力约束,提出一种基于相对轨道根数动力学模型的多脉冲机动规划算法。对于相对轨道面内各分量之间的控制耦合问题,基于“先控制相对形状、后修正迹向距离”的策略,提出了满足速度增量约束的多脉冲机动规划算法;分析了近地轨道 J 2 摄动和大气阻力摄动对相对轨道的影响,并基于线性化的状态转移模型提出了迭代优化策略,以降低立方星在摄动影响下的轨道机动误差。仿真结果表明,所提出的多脉冲机动规划算法在不同任务条件下均可获得有效的机动规划,迭代优化策略可有效地提高终点位置的精度,在基于高精度轨道递推搭建的任务仿真中也验证了算法的有效性,可用于立方星编队构建和重构任务。  相似文献   

9.
针对时间固定的两航天器追逃问题,提出一种以半直接配点法研究追逃双方最优控制策略的求解方法。航天器追逃问题是基于微分对策的追逃问题,该问题是含有追逐者和逃逸者控制变量的两点边值问题。若采用必要条件求解,则对迭代初值要求高,收敛困难。在两航天器均为连续小推力的假设条件下,以终端距离为支付函数,给出半直接配点法的求解过程。在此数值方法中,根据半直接转换将微分对策问题转化为最优控制问题,采用Gauss-Lobbato配点法将此最优问题最终转化为非线性规划问题,继而通过序列二次规划算法求解。这种半直接配点法避免了对微分对策问题最优策略的必要条件(两点边值问题)求解。采用该方法求解对迭代初值不敏感,且数值稳定性好。数值仿真实例验证了这种求解方法的可行性。该方法提高了求解两点边值问题的收敛性,为求解含有双方控制变量的微分对策问题提供了一种思路。  相似文献   

10.
针对航天器末端拦截博弈问题,基于微分对策理论研究了各星的博弈策略。根据拦截空间是否具有防御器将博弈态势分为双星博弈和三星博弈。首先考虑拦截器与目标的双星博弈态势,以终端脱靶量为指标设计了相对博弈策略,并提出时间分析方程以提高策略对不同拦截态势的自适应性。然后,考虑具有防御器的三星博弈态势,提出了博弈切换策略将其化为分段双星博弈,并将双边时间方程扩展到三星博弈中,使拦截器在不被防御器反拦截的情况下,实现对目标的快速拦截。最后仿真分析了博弈策略与时间分析方程对航天器拦截博弈问题的有效性。  相似文献   

11.
专科学生英语学习动机研究   总被引:3,自引:0,他引:3  
学习动机与学生的学习态度、学习策略及学习成绩是紧密相关的.它直接制约着学习的积极性,极大地影响着学生的外语学习效果.本文介绍了对大学生英语学习动机研究的过程及其教学启示.  相似文献   

12.
学习动机与学生的学习态度、学习策略及学习成绩是紧密相关的。它直接制约着学习的积极性,极大地影响着学生的外语学习效果。本文介绍了对大学生英语学习动机研究的过程及其教学启示。  相似文献   

13.
本文以国内外第二语言学习策略相关理论为基础,对非英语专业新生英语学习策略的使用情况进行了问卷调查,通过实证性研究分析,摸清了非英语专业新生的英语学习策略总体使用情况,以及学习策略的使用与性别的关系,并就如何培养非英语专业新生大学英语学习策略进行了初步探讨。  相似文献   

14.
Abstract

The nature of route learning in terms of the memorizing of landmarks was investigated. In Experiment 1, participants memorized landmarks while being guided through a computer-simulated hallway (dynamic, with spatial context), or while viewing the landmarks one by one in front of a black background (static, without context). Two more conditions completed the 2 × 2 design. One condition preserved the dynamic landmark viewing properties (observers approached each object, passed it, turned to the next object, and so on), but the background was black (dynamic, without context). In the other condition the observer saw a stationary display of each object within a hallway, but did not approach the object (static, with context). Serial recall was much better after viewing the landmarks in the dynamic presentation format with spatial context than in the other conditions. Experiment 2 showed that the superior performance in the dynamic condition with context was abolished when all hallway segments were equally long. This implies that metric information is a component of route knowledge at a very early stage, which is incompatible with the dominant framework, but is compatible with the alternative framework for spatial microgenesis.  相似文献   

15.
一种基于迁移学习的遥测数据异常检测方法   总被引:1,自引:0,他引:1       下载免费PDF全文
陈俊夫  皮德常  张强 《宇航学报》2021,42(4):522-530
为解决卫星遥测数据异常检测面临的数据不平衡且缺乏有标签样本的问题,提出一种基于一维卷积神经网络(1dCNN)迁移学习的异常检测方法.首先利用源域卫星的遥测数据对1dCNN进行预训练,使得模型的卷积层具有卫星状态特征的提取能力;然后将训练好的模型迁移到缺乏标签数据的目标域卫星中;利用目标域有标签样本对预训练模型进行微调,...  相似文献   

16.
随着改革开放进程的加快我国社会迅猛向前发展,与此同时推动我国与国际世界的交往日益频繁,因此培养大量的有专业知识和技能同时能够熟练掌握一门外语的高级专业人才成为我国社会的紧迫任务。对于在校非英语专业的大学生来说,他们把大量时问都花在了本专业知识的学习上,因此英语学习时间就变得捉襟现肘,所以培养他们英语自主学习能力进而提高其英语学习效率就变得尤为重要。本文将首先介绍自主学习定义,然后阐述提倡自主学习的必要性,最后研究总结出如何提高非专业大一新生大学英语自主学习能力的策略。  相似文献   

17.
针对预先设定学习率的增量强化学习(IRL)飞行控制律失败率较高,并且无法适应飞行器大范围动力学特性变化下的稳定控制问题,提出一种自适应学习率的增量强化学习(ALRIRL)控制方法.首先,基于小波分析方法构造控制系统稳定度评价函数,用于评估控制器稳定度.然后,基于梯度下降法设计学习率在线迭代计算方法,以提升强化学习控制器...  相似文献   

18.
刘婷  杨博  于泽芳 《上海航天》2021,38(4):45-51
针对空间粒子辐射效应评价中的多因素影响问题,提出了端到端数据驱动方法预测多因素条件下的单粒子翻转截面。首先通过卷积神经网络进行多因素特征提取,接着利用小样本学习匹配网络进行样本间特征融合,最后使用集成学习回归器预测重离子线性能量传输和单粒子翻转截面的关系曲线。在公开文献中提取的2种类型182个样本的小规模数据集上,对该模型进行端到端训练和测试,结果表明:该方法能够有效预测大部分场景下的多因素效应单粒子翻转界面,并能对各因素的重要程度给出量化评价,在国产处理器SM750的案例分析中获得了与重离子辐照实验相当的系统失效率上界。与传统方法相比,这种方法不依赖经验参数,具有更广泛的应用场景。  相似文献   

19.
王冠  夏红伟 《宇航学报》2023,44(2):233-242
针对吸气式高超声速飞行器的飞行控制问题,提出一种基于学习的智能控制方法。为便于控制器设计,将飞行器动力学模型划分为速度子系统和高度子系统:为解决速度子系统控制输入受限的问题,提出一种基于强化学习的智能控制方案;对于考虑有限通信资源的高度子系统跟踪控制问题,提出一种基于事件触发的确定学习控制方案。该方案包含离线学习训练和在线触发控制两个阶段。首先在本地离线学习训练阶段获取并存储系统的未知动态知识,随后利用所获取的经验知识设计基于事件触发机制的在线触发控制器。本文所提方案基于学习的思想将离线学习训练获取的智能体和经验知识应用于在线控制,使得所提方案能够快速计算控制指令且通信资源占用少。仿真结果说明了所提出方法的有效性。  相似文献   

20.
为实时有效地识别和监测雾霾,选取2013年10月4日与10月5日的两景MODIS遥感图像,利用不同类型像元的光谱差异,基于神经网络模型,建立海上雾霾的遥感识别机器学习算法。经检验表明,在晴空条件下,机器学习算法反演精度相对较高,已超过98%,利用算法可以实现对中国近海上空雾霾的监测。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号