共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
多智能体机器人系统的合作编队行为研究 总被引:10,自引:0,他引:10
本文建立了多智能体机器人系统合作编队的数学模型,并分析了它的特点;引入“队形向量”控制多个智能机器人能够编队包围捕获“入侵者”;提出了一个通信协调模型以解决系统的冲突和掉队问题;给出了系统的仿真结果。 相似文献
4.
5.
针对信息非完备约束下航天器轨道博弈难以自主决策的问题,基于多智能体强化学习提出一种多航天器轨道博弈决策方法。首先建立轨道博弈动力学和信息非完备约束。其次建立用于训练和决策的神经网络模型,依据分布式系统架构对网络的输入输出结构进行设计,并引入具有记忆功能的长短期记忆网络(LSTM),根据航天器轨道运动在时间、空间连续的属性,补偿位置、速度测量信息的非完备性。然后采用近端策略优化(PPO)算法开展红蓝左右互搏式学习训练。最后通过三组对比训练实验,验证了所提出的方法在信息非完备约束下能够有效增强学习训练过程的稳定性,并提升任务完成率和降低燃料消耗。 相似文献
6.
7.
随着通信技术的发展,信号体制、调制方式日趋复杂,例如CPM、OFDM等,这给调制识别技术带来了巨大挑战。近年来,深度学习技术由于其强大的特征提取能力和分类能力,被广泛应用到模式识别领域中。为了实现复杂调制方式的识别,文章将深度学习技术引入到调制识别领域,并提出一种基于改进的CLDNN模型的调制识别算法。CLDNN模型已被成功应用到语音识别领域,其表现出了强大的特征提取和分类能力。该方法在原有CLDNN模型的基础上,针对调制识别问题的特点,对CLDNN进行了改进。而且该方法不依赖于载波同步、码元同步等预处理。实验结果表明,该方法可同时识别12种信号调制方式和信号体制,信噪比在3dB以上时,整体识别准确率达到90%以上,并且可以较好地识别复杂调制方式和信号体制。 相似文献
8.
针对航天器轨道追逃博弈问题,提出一种多阶段学习训练赋能方法,使得追踪星在终端时刻抵近逃逸星的特定区域,而逃逸星需要通过轨道机动规避追踪星。首先,构建两星的训练策略集,基于逻辑规则设计追踪星和逃逸星的机动策略,通过实时预测对方的终端位置,设计己方的期望位置和脉冲策略,显式给出追逃策略的解析表达式,用于训练赋能;其次,为提升航天器的训练赋能效率及应对未知环境的博弈能力,提出一种基于强化学习技术多模式、分阶段的学习训练方法,先使追踪星和逃逸星分别应对上述逻辑规则引导下的逃逸星和追踪星,完成预训练;再次,开展二次训练,两星都采用邻近策略优化(PPO)策略进行追逃博弈,在博弈中不断调整网络权值,提升决策能力;最后,在仿真环境中验证提出的训练方法的有效性,经过二次训练后,追踪星和逃逸星可有效应对不同策略驱动下的对手,提升追逃成功率。 相似文献
9.
多航天器编队飞行在深空探测及协同对地观测等领域有着重要应用,而多航天器的姿态跟踪及协同控制技术作为其关键技术之一也引起了极大的关注。近年来,随着分布式人工智能技术的发展,多智能体系统(MASs)受到了航天器控制领域学者的关注并将其应用到多航天器编队控制中。本文回顾了多智能体系统协同控制及其在多航天器编队姿态协同控制中应用的研究进展。首先,从多航天器编队不同控制需求出发,分别从一致性跟踪控制、有限时间控制、事件驱动控制方面,回顾了多智能体系统协同控制问题的进展;其次,回顾了多航天器姿态协同控制在上述需求方面的研究进展,并基于多智能体系统的协同控制理论,提出了相应的分布式姿态协同控制策略。 相似文献
10.
11.
文章介绍了多体回收技术在长期在轨运行的侦察卫星中的作用 ,以及国际上对这项技术的研究和应用情况 ,说明了这项技术在目前中国实施卫星照相详查任务中的现实意义。最后还对应该采取的研制方案作了简单叙述。 相似文献
12.
13.
14.
《北华航天工业学院学报》2016,(1):19-21
多智能体编队控制是当今控制领域的一个重点问题,其研究的核心问题是实现多智能体的避障控制及在此基础上搜索最优解。本文基于人工势场算法,对多智能体的编队避障控制进行了仿真研究,实现了多智能体的编队和避障。 相似文献
15.
研究了二阶多智能体系统跟踪一致问题。针对相对速度信息未知的网络,分析了有时滞和无时滞情况下网络的稳定性,给出了系统能够实现跟踪一致的条件。最后,通过仿真表明所提协议比现有协议性能更好。 相似文献
16.
17.
18.
19.
针对高速机动飞行器常用的程序化机动突防方式适应性不强、突防效果不稳定的问题,提出了一种基于深度强化学习算法的机动博弈制导方法。该方法以增大交会摆脱量为任务目标,采用深度神经网络拟合飞行器的制导律,应用强化学习方法训练网络参数,得到一种以突防拦截双方的位置和速度为输入、以飞行器的需用过载为输出的智能机动博弈制导律。数学仿真验证结果表明,在连续的状态空间和动作空间中,飞行器能根据当前态势自主选择合适的制导指令。相比传统突防方式,该制导律显著提升了交会摆脱量,且突防效果更稳定。 相似文献
20.
基于车辆定位的北京公交智能调度指挥系统 总被引:1,自引:0,他引:1
介绍了先进的北京市公共交通智能调度指挥系统 ,包括其各个子系统。着重描述其中的公交车辆定位系统 ,该系统采用高精度的差分 GPS、无线数据传输和话音调度 ,利用已有的模拟集群通信系统 ,终端显示为先进的地理信息系统。整个系统将给调度员提供方便、直观、含位置及状态的全方位车辆信息 ,提高公共交通运营的效率 相似文献