期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李波越凯强甘志刚高佩忻《宇航学报》2021,42(6):757-765

针对多无人机任务决策方法研究中传统优化算法难以在短时间内得到期望结果的问题,基于深度强化学习提出一种无人机多智能体深度确定性策略梯度(MADDPG)算法,通过允许无人机在学习时使用全局信息,在应用决策的时候只使用局部信息的方法,从网络结构、状态空间、动作空间和奖励函数设计了 MADDPG算法的模型结构.最后通过仿真实验... 相似文献

2.

信息非完备下多航天器轨道博弈强化学习方法

下载免费PDF全文

王英杰袁利汤亮黄煌耿远卓《宇航学报》2023,(10):1522-1533

针对信息非完备约束下航天器轨道博弈难以自主决策的问题，基于多智能体强化学习提出一种多航天器轨道博弈决策方法。首先建立轨道博弈动力学和信息非完备约束。其次建立用于训练和决策的神经网络模型，依据分布式系统架构对网络的输入输出结构进行设计，并引入具有记忆功能的长短期记忆网络(LSTM),根据航天器轨道运动在时间、空间连续的属性，补偿位置、速度测量信息的非完备性。然后采用近端策略优化(PPO)算法开展红蓝左右互搏式学习训练。最后通过三组对比训练实验，验证了所提出的方法在信息非完备约束下能够有效增强学习训练过程的稳定性，并提升任务完成率和降低燃料消耗。相似文献

3.

基于任务分解的多星成像规划模型建立与求解 总被引：1，自引：0，他引：1

朱政霖马广彬黄鹏林友明《航天器工程》2018,(2):6-13

为解决多星成像规划模型中求解算法任务分配不合理、运算效率较低等问题,根据卫星性能指标和遥感器成像能力等约束条件,建立多星成像规划模型。求解该模型时,基于免疫算法设计任务分配方案,并基于图的最长路径算法设计单轨道圈次调度方案,使卫星能够尽可能多地对分配至该轨道圈次的点目标成像。将单轨道圈次调度结果作为反馈信息,调整任务分配方案,并通过多次迭代使得出的结果接近全局最优解。以多颗卫星对不同数量的点目标成像为条件,对模型进行测试,并与现有的规划模型对比。结果表明:文章提出的模型,能够在较短的时间内求解多星成像规划问题,得出较优的成像方案。相似文献

4.

一种深度强化学习制导控制一体化算法

裴培何绍溟王江林德福《宇航学报》2021,42(10):1293-1304

研究了一种基于深度强化学习理论的制导控制一体化算法。不同于传统的制导控制一体化算法和制导控制回路分开设计的方法,基于深度强化学习理论的制导控制一体化算法利用深度学习强化算法生成一个智能体,智能体根据导弹的观测量生成舵偏角控制指令准确拦截目标。首先将制导控制问题转化为一个马尔可夫决策过程,然后提出了一个权衡制导精度、能量损耗和飞行时间的奖励函数,将制导控制问题转化到强化学习问题的框架中。最后采用深度确定性策略梯度算法,求解提出的强化学习问题,训练得到制导控制智能体,智能体根据导弹观测量生成舵偏角指令。通过进行大量的数值模拟,验证了提出的制导控制一体化算法的有效性和鲁棒性。相似文献

5.

多智能体编队仿真控制研究

《北华航天工业学院学报》2016,(1):19-21

多智能体编队控制是当今控制领域的一个重点问题,其研究的核心问题是实现多智能体的避障控制及在此基础上搜索最优解。本文基于人工势场算法,对多智能体的编队避障控制进行了仿真研究,实现了多智能体的编队和避障。相似文献

6.

基于DDQN的运载火箭姿态控制器参数设计 总被引：1，自引：0，他引：1

黄旭柳嘉润骆无意《航天控制》2020,38(4):3-8

探索了利用深度强化学习算法训练智能体,以代替人类工程师进行火箭姿态控制器参数的离线设计方案。建立了多特征秒的火箭频域分析模型,选定了设计参数。选择深度强化学习算法中的双深度Q学习(Double Deep Q Network,DDQN)算法,通过记忆回放和时间差分迭代的方式让智能体在与环境交互过程中不断学习。设计了对应的马尔科夫决策过程模型,进行了智能体的训练和前向测试。结果说明该方法对于运载火箭姿控设计具有一定参考价值。相似文献

7.

基于多智能体系统的多航天器编队分布式姿态协同控制

下载免费PDF全文

刘向东刘海阔杜长坤田野路平立陈振《上海航天》2022,39(4):94-103

多航天器编队飞行在深空探测及协同对地观测等领域有着重要应用,而多航天器的姿态跟踪及协同控制技术作为其关键技术之一也引起了极大的关注。近年来,随着分布式人工智能技术的发展,多智能体系统(MASs)受到了航天器控制领域学者的关注并将其应用到多航天器编队控制中。本文回顾了多智能体系统协同控制及其在多航天器编队姿态协同控制中应用的研究进展。首先,从多航天器编队不同控制需求出发,分别从一致性跟踪控制、有限时间控制、事件驱动控制方面,回顾了多智能体系统协同控制问题的进展;其次,回顾了多航天器姿态协同控制在上述需求方面的研究进展,并基于多智能体系统的协同控制理论,提出了相应的分布式姿态协同控制策略。相似文献

8.

分布式协同微纳遥感星群的智能控制系统关键技术

下载免费PDF全文

刘付成韩飞韩宇武海雷李木子史可懿《上海航天》2022,39(4):1-24

近年来，国内外微纳遥感星座发展不断加速，通过高频重访大幅提升了对地观测的时间分辨率，但是由于单颗微纳卫星观测能力受限，难以满足多源同步与融合、高品质、大幅宽等数据应用需求。为此，将星座与星簇相结合，以星座化分布满足高时间分辨率需求，以星座节点上的星簇协同观测获取多源、高品质、宽幅数据，构建基于微纳卫星的分布式协同遥感系统，是兼顾上述遥感应用需求的有效途径。智能分布式协同控制是该系统的核心关键，为此，必须研究解决星座+星簇大规模动态微纳遥感星群控制系统的分布协同自主导航、智能运动规划与控制、智能健康预测与管理、智能组网等关键技术难题。在梳理分析国内外分布式微纳遥感系统的基础上，给出分布式协同微纳遥感星群的概念内涵，分析其特有的四方面难题，梳理总结相关技术发展现状与趋势，以期为后续该方向的研究起到一定的借鉴作用。相似文献

9.

基于优势行动-评论的雷达自主干扰决策方法

梁猛王卫余波陈飞曹育维《航天电子对抗》2023,(5):17-21

随着认知电子战技术的不断发展,传统雷达干扰决策方法效率低、准确性差等缺点日益凸显。为解决该问题,提出了一种基于优势行动-评论（A2C）的雷达自主干扰决策方法。该方法以A2C强化学习算法为基础构建干扰决策智能体,智能体通过观察环境状态并不断与敌方雷达进行交互以学习自身的干扰策略,最终实时给出有效的干扰决策。最后通过仿真实验对比分析了Deep Q Network (DQN)算法和A2C算法在实时性和准确率等方面的优劣。仿真结果表明,A2C算法具有在未知环境下的干扰策略快速学习和决策的能力,可有效支撑认知电子战背景下的干扰策略选择。相似文献

10.

基于Sarsa(λ)强化学习的空间机械臂路径规划研究

下载免费PDF全文

徐帷卢山《宇航学报》2019,40(4):435-443

针对目标特性未知的在轨操作环境,研究了典型空间操作机械臂的路径规划策略。采用Sarsa(λ)强化学习方法实现目标跟踪及避障的自主路径规划与智能决策,该方法将机械臂系统的每节臂视为一个决策智能体,通过感知由目标偏差和障碍距离程度组成的二维状态,设计符合人工经验的拟合奖赏函数,进行各臂转动动作的强化训练,最终形成各智能体的状态-动作值函数表,即可作为机械臂在线路径规划的决策依据。将本方法应用于多自由度空间机械臂路径规划任务,仿真结果表明新算法能在有限训练次数内实现对移动目标的稳定跟踪与避障,同时各智能体通过学习所得的状态-动作值函数表,具备较强的后期在线自主调整能力,从而验证了算法较强的鲁棒性和智能性。相似文献

11.

智能博弈趋势下未来空天防御体系展望 总被引：1，自引：1，他引：0

下载免费PDF全文

王波兰《上海航天》2021,38(3):46-52

当前,军事智能化正成为继机械化、信息化之后推动新一轮军事变革的强大动力,深刻影响着未来战争的制胜机理、作战规则及战争形态.本文全面分析了智能化在未来空天防御体系的应用优势,结合国外智能化防御体系发展特点,提出了未来智能空天防御体系发展设想,梳理了空天防御体系智能化关键技术,阐述了空天防御体系智能化变革的重要意义. 相似文献

12.

深空探测器热控系统设计方法研究 总被引：1，自引：0，他引：1

向艳超吴燕邵兴国《航天器工程》2007,16(6):82-86

针对国外深空探测器热控系统设计方法进行了调研和综述,并在此基础上提出了深空探测器的热控系统设计特点,为我国深空探测器热控系统的设计提供参考。相似文献

13.

一种深空探测器电源共用的方法 总被引：1，自引：0，他引：1

雷英俊张明井元良金波《航天器工程》2014,(1):68-72

针对深空探测器重量约束苛刻的特点,提出了一种适合探测器A和B组合体的电源共用方法,充分利用探测器A和B电源控制器原有的功率模块,设计电源共用电路和一套逻辑控制指令,通过两器间的电接口实现电源共用,并对该方法的技术先进性进行了详细分析,可为深空探测器电源系统设计提供参考。相似文献

14.

基于多智能体强化学习的轨道追逃博弈方法 总被引：1，自引：0，他引：1

下载免费PDF全文

许旭升党朝辉宋斌袁秋帆肖余之《上海航天》2022,39(2):24-31

针对空间轨道博弈过程中的集群卫星和非合作目标追逃博弈情形下的动力学模型复杂、非合作目标机动信息未知,以及卫星间难以有效协调等问题,提出一种基于多智能体深度强化学习算法的集群卫星空间轨道追逃博弈方法.首先通过对博弈场景进行建模,在考虑最短时间、最优燃料以及碰撞规避的情形下进行奖励函数的塑造和改进,利用深度强化学习方法中的... 相似文献

15.

采用MPPT技术的国外深空探测器电源系统综述 总被引：4，自引：3，他引：1

刘治钢蔡晓东陈琦田凯《航天器工程》2011,20(5):105-110

最大功率点跟踪（MPPT）技术能够最大限度利用太阳电池阵输出功率,对于光强和温度变化较大的深空探测器,具有一定的优势。对MPPT电源系统拓扑结构及其在国外深空探测领域的典型应用,如＂罗塞塔＂（Rosetta）、＂信使＂（MESSENGER）探测器电源系统等,进行了调研和综述,分析了3种MPPT拓扑结构的特点,并指出光强、温度等空间环境因素,以及负载特性、系统稳定性对电源系统的影响,可为MPPT技术在我国深空探测器电源系统设计中应用提供参考。相似文献

16.

美国空间同位素能源装置发展现状 总被引：6，自引：1，他引：5

侯欣宾王立《航天器工程》2007,16(2):41-49

介绍了美国空间同位素能源装置的发展历史、主要工作原理和安全方面的考虑,重点介绍了美国已经发展的和正在进行研制的多种空间同位素能源装置的结构组成。相似文献

17.

应用于深空探测的VLBI技术

李金岭张津维刘鹂郭丽钱志瀚《航天器工程》2012,21(2):62-67

分析了河外射电源与空间飞行器甚长基线干涉测量（VLBI）跟踪与资料解析的差异,包括信号波前形式、频谱特征、误差修正方式、解算参数类型和软件实时性需求等。讨论了应用于深空探测的包括宽带、窄带、同波束、多频点、多基线相位参考、连线干涉和局部参考架等多种差分VLBI技术,可作为VLBI技术在我国深空探测应用中技术设计参考。相似文献

18.

一种载人航天器深空通信系统架构的设想

王玮梁克郑伟《航天器工程》2013,(6):18-23

为保证深空探测载人航天器与地面之间的可靠通信,在分析载波频率、信源压缩技术、编码技术和调制方式的基础上,提出了一种载人航天器深空通信系统架构,综合考虑各种通信业务的需求,采用LDPC编码、SOQPSK调制等先进技术,充分利用深空通信信道宽带宽的特点。相比于现有的深空探测航天器,文章提出的深空通信系统架构可获得更高的增益,能以更高的数据速率进行可靠通信,具有一定的技术前瞻性和较高的工程应用价值,对我国后续载人登月及其他深空飞行任务具有一定的参考意义。相似文献

19.

基于木星大气环境的降落伞系统气动特性研究

周宁韦彦靖贾贺荣伟王奇蒋伟薛晓鹏《航天返回与遥感》2023,44(2):1-13

木星探测是未来行星探测的重要发展方向,而降落伞是进入木星大气探测必不可少的气动减速装置。文章基于“伽利略号”探测任务,设计了满足未来木星探测需求的降落伞系统简化模型,并针对该降落伞系统进行了数值模拟,研究了木星大气和地球风洞实验环境中不同来流马赫数下降落伞系统的复杂流动现象及气动力变化规律。在木星大气环境中,降落伞的阻力系数和横向力系数大小以及横向力系数波动幅度均高于风洞试验环境,阻力系数波动幅度均低于风洞实验环境。此外,还研究了木星大气环境中不同来流攻角下降落伞系统的气动特性。研究表明,木星大气环境中降落伞系统气动特性与风洞实验结果有差异,因此未来在设计用于木星探测的降落伞系统时,应考虑由于木星大气环境对降落伞系统气动特性的影响。相似文献