首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
针对多无人机任务决策方法研究中传统优化算法难以在短时间内得到期望结果的问题,基于深度强化学习提出一种无人机多智能体深度确定性策略梯度(MADDPG)算法,通过允许无人机在学习时使用全局信息,在应用决策的时候只使用局部信息的方法,从网络结构、状态空间、动作空间和奖励函数设计了 MADDPG算法的模型结构.最后通过仿真实验...  相似文献   

2.
王英杰  袁利  汤亮  黄煌  耿远卓 《宇航学报》2023,(10):1522-1533
针对信息非完备约束下航天器轨道博弈难以自主决策的问题,基于多智能体强化学习提出一种多航天器轨道博弈决策方法。首先建立轨道博弈动力学和信息非完备约束。其次建立用于训练和决策的神经网络模型,依据分布式系统架构对网络的输入输出结构进行设计,并引入具有记忆功能的长短期记忆网络(LSTM),根据航天器轨道运动在时间、空间连续的属性,补偿位置、速度测量信息的非完备性。然后采用近端策略优化(PPO)算法开展红蓝左右互搏式学习训练。最后通过三组对比训练实验,验证了所提出的方法在信息非完备约束下能够有效增强学习训练过程的稳定性,并提升任务完成率和降低燃料消耗。  相似文献   

3.
基于任务分解的多星成像规划模型建立与求解   总被引:1,自引:0,他引:1  
为解决多星成像规划模型中求解算法任务分配不合理、运算效率较低等问题,根据卫星性能指标和遥感器成像能力等约束条件,建立多星成像规划模型。求解该模型时,基于免疫算法设计任务分配方案,并基于图的最长路径算法设计单轨道圈次调度方案,使卫星能够尽可能多地对分配至该轨道圈次的点目标成像。将单轨道圈次调度结果作为反馈信息,调整任务分配方案,并通过多次迭代使得出的结果接近全局最优解。以多颗卫星对不同数量的点目标成像为条件,对模型进行测试,并与现有的规划模型对比。结果表明:文章提出的模型,能够在较短的时间内求解多星成像规划问题,得出较优的成像方案。  相似文献   

4.
裴培  何绍溟  王江  林德福 《宇航学报》2021,42(10):1293-1304
研究了一种基于深度强化学习理论的制导控制一体化算法。不同于传统的制导控制一体化算法和制导控制回路分开设计的方法,基于深度强化学习理论的制导控制一体化算法利用深度学习强化算法生成一个智能体,智能体根据导弹的观测量生成舵偏角控制指令准确拦截目标。首先将制导控制问题转化为一个马尔可夫决策过程,然后提出了一个权衡制导精度、能量损耗和飞行时间的奖励函数,将制导控制问题转化到强化学习问题的框架中。最后采用深度确定性策略梯度算法,求解提出的强化学习问题,训练得到制导控制智能体,智能体根据导弹观测量生成舵偏角指令。通过进行大量的数值模拟,验证了提出的制导控制一体化算法的有效性和鲁棒性。  相似文献   

5.
多智能体编队控制是当今控制领域的一个重点问题,其研究的核心问题是实现多智能体的避障控制及在此基础上搜索最优解。本文基于人工势场算法,对多智能体的编队避障控制进行了仿真研究,实现了多智能体的编队和避障。  相似文献   

6.
基于DDQN的运载火箭姿态控制器参数设计   总被引:1,自引:0,他引:1  
探索了利用深度强化学习算法训练智能体,以代替人类工程师进行火箭姿态控制器参数的离线设计方案。建立了多特征秒的火箭频域分析模型,选定了设计参数。选择深度强化学习算法中的双深度Q学习(Double Deep Q Network,DDQN)算法,通过记忆回放和时间差分迭代的方式让智能体在与环境交互过程中不断学习。设计了对应的马尔科夫决策过程模型,进行了智能体的训练和前向测试。结果说明该方法对于运载火箭姿控设计具有一定参考价值。  相似文献   

7.
多航天器编队飞行在深空探测及协同对地观测等领域有着重要应用,而多航天器的姿态跟踪及协同控制技术作为其关键技术之一也引起了极大的关注。近年来,随着分布式人工智能技术的发展,多智能体系统(MASs)受到了航天器控制领域学者的关注并将其应用到多航天器编队控制中。本文回顾了多智能体系统协同控制及其在多航天器编队姿态协同控制中应用的研究进展。首先,从多航天器编队不同控制需求出发,分别从一致性跟踪控制、有限时间控制、事件驱动控制方面,回顾了多智能体系统协同控制问题的进展;其次,回顾了多航天器姿态协同控制在上述需求方面的研究进展,并基于多智能体系统的协同控制理论,提出了相应的分布式姿态协同控制策略。  相似文献   

8.
近年来,国内外微纳遥感星座发展不断加速,通过高频重访大幅提升了对地观测的时间分辨率,但是由于单颗微纳卫星观测能力受限,难以满足多源同步与融合、高品质、大幅宽等数据应用需求。为此,将星座与星簇相结合,以星座化分布满足高时间分辨率需求,以星座节点上的星簇协同观测获取多源、高品质、宽幅数据,构建基于微纳卫星的分布式协同遥感系统,是兼顾上述遥感应用需求的有效途径。智能分布式协同控制是该系统的核心关键,为此,必须研究解决星座+星簇大规模动态微纳遥感星群控制系统的分布协同自主导航、智能运动规划与控制、智能健康预测与管理、智能组网等关键技术难题。在梳理分析国内外分布式微纳遥感系统的基础上,给出分布式协同微纳遥感星群的概念内涵,分析其特有的四方面难题,梳理总结相关技术发展现状与趋势,以期为后续该方向的研究起到一定的借鉴作用。  相似文献   

9.
随着认知电子战技术的不断发展,传统雷达干扰决策方法效率低、准确性差等缺点日益凸显。为解决该问题,提出了一种基于优势行动-评论(A2C)的雷达自主干扰决策方法。该方法以A2C强化学习算法为基础构建干扰决策智能体,智能体通过观察环境状态并不断与敌方雷达进行交互以学习自身的干扰策略,最终实时给出有效的干扰决策。最后通过仿真实验对比分析了Deep Q Network (DQN)算法和A2C算法在实时性和准确率等方面的优劣。仿真结果表明,A2C算法具有在未知环境下的干扰策略快速学习和决策的能力,可有效支撑认知电子战背景下的干扰策略选择。  相似文献   

10.
徐帷  卢山 《宇航学报》2019,40(4):435-443
针对目标特性未知的在轨操作环境,研究了典型空间操作机械臂的路径规划策略。采用Sarsa(λ)强化学习方法实现目标跟踪及避障的自主路径规划与智能决策,该方法将机械臂系统的每节臂视为一个决策智能体,通过感知由目标偏差和障碍距离程度组成的二维状态,设计符合人工经验的拟合奖赏函数,进行各臂转动动作的强化训练,最终形成各智能体的状态-动作值函数表,即可作为机械臂在线路径规划的决策依据。将本方法应用于多自由度空间机械臂路径规划任务,仿真结果表明新算法能在有限训练次数内实现对移动目标的稳定跟踪与避障,同时各智能体通过学习所得的状态-动作值函数表,具备较强的后期在线自主调整能力,从而验证了算法较强的鲁棒性和智能性。  相似文献   

11.
智能博弈趋势下未来空天防御体系展望   总被引:1,自引:1,他引:0       下载免费PDF全文
王波兰 《上海航天》2021,38(3):46-52
当前,军事智能化正成为继机械化、信息化之后推动新一轮军事变革的强大动力,深刻影响着未来战争的制胜机理、作战规则及战争形态.本文全面分析了智能化在未来空天防御体系的应用优势,结合国外智能化防御体系发展特点,提出了未来智能空天防御体系发展设想,梳理了空天防御体系智能化关键技术,阐述了空天防御体系智能化变革的重要意义.  相似文献   

12.
深空探测器热控系统设计方法研究   总被引:1,自引:0,他引:1  
针对国外深空探测器热控系统设计方法进行了调研和综述,并在此基础上提出了深空探测器的热控系统设计特点,为我国深空探测器热控系统的设计提供参考。  相似文献   

13.
一种深空探测器电源共用的方法   总被引:1,自引:0,他引:1  
针对深空探测器重量约束苛刻的特点,提出了一种适合探测器A和B组合体的电源共用方法,充分利用探测器A和B电源控制器原有的功率模块,设计电源共用电路和一套逻辑控制指令,通过两器间的电接口实现电源共用,并对该方法的技术先进性进行了详细分析,可为深空探测器电源系统设计提供参考。  相似文献   

14.
基于多智能体强化学习的轨道追逃博弈方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对空间轨道博弈过程中的集群卫星和非合作目标追逃博弈情形下的动力学模型复杂、非合作目标机动信息未知,以及卫星间难以有效协调等问题,提出一种基于多智能体深度强化学习算法的集群卫星空间轨道追逃博弈方法.首先通过对博弈场景进行建模,在考虑最短时间、最优燃料以及碰撞规避的情形下进行奖励函数的塑造和改进,利用深度强化学习方法中的...  相似文献   

15.
采用MPPT技术的国外深空探测器电源系统综述   总被引:4,自引:3,他引:1  
最大功率点跟踪(MPPT)技术能够最大限度利用太阳电池阵输出功率,对于光强和温度变化较大的深空探测器,具有一定的优势。对MPPT电源系统拓扑结构及其在国外深空探测领域的典型应用,如"罗塞塔"(Rosetta)、"信使"(MESSENGER)探测器电源系统等,进行了调研和综述,分析了3种MPPT拓扑结构的特点,并指出光强、温度等空间环境因素,以及负载特性、系统稳定性对电源系统的影响,可为MPPT技术在我国深空探测器电源系统设计中应用提供参考。  相似文献   

16.
美国空间同位素能源装置发展现状   总被引:6,自引:1,他引:5  
介绍了美国空间同位素能源装置的发展历史、主要工作原理和安全方面的考虑,重点介绍了美国已经发展的和正在进行研制的多种空间同位素能源装置的结构组成。  相似文献   

17.
分析了河外射电源与空间飞行器甚长基线干涉测量(VLBI)跟踪与资料解析的差异,包括信号波前形式、频谱特征、误差修正方式、解算参数类型和软件实时性需求等。讨论了应用于深空探测的包括宽带、窄带、同波束、多频点、多基线相位参考、连线干涉和局部参考架等多种差分VLBI技术,可作为VLBI技术在我国深空探测应用中技术设计参考。  相似文献   

18.
为保证深空探测载人航天器与地面之间的可靠通信,在分析载波频率、信源压缩技术、编码技术和调制方式的基础上,提出了一种载人航天器深空通信系统架构,综合考虑各种通信业务的需求,采用LDPC编码、SOQPSK调制等先进技术,充分利用深空通信信道宽带宽的特点。相比于现有的深空探测航天器,文章提出的深空通信系统架构可获得更高的增益,能以更高的数据速率进行可靠通信,具有一定的技术前瞻性和较高的工程应用价值,对我国后续载人登月及其他深空飞行任务具有一定的参考意义。  相似文献   

19.
木星探测是未来行星探测的重要发展方向,而降落伞是进入木星大气探测必不可少的气动减速装置。文章基于“伽利略号”探测任务,设计了满足未来木星探测需求的降落伞系统简化模型,并针对该降落伞系统进行了数值模拟,研究了木星大气和地球风洞实验环境中不同来流马赫数下降落伞系统的复杂流动现象及气动力变化规律。在木星大气环境中,降落伞的阻力系数和横向力系数大小以及横向力系数波动幅度均高于风洞试验环境,阻力系数波动幅度均低于风洞实验环境。此外,还研究了木星大气环境中不同来流攻角下降落伞系统的气动特性。研究表明,木星大气环境中降落伞系统气动特性与风洞实验结果有差异,因此未来在设计用于木星探测的降落伞系统时,应考虑由于木星大气环境对降落伞系统气动特性的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号