共查询到20条相似文献,搜索用时 453 毫秒
1.
2.
基于多智能体混合学习的多星协同动态任务规划算法(英文) 总被引:2,自引:1,他引:1
针对多星协同动态任务规划问题,以往多采用基于启发式的重规划算法,但是由于启发式策略依赖于具体任务,使得优化性受到影响。注意到协同规划的历史信息对后续协同规划的影响,本文提出了一种基于策略迭代的多智能体强化学习和迁移学习的混合学习算法求解该问题近似最优策略。本文的多智能体强化学习方法利用神经网络描述各颗卫星的强化学习策略,通过协同进化的方法迭代搜索具有最优拓扑结构和连接权重的策略神经网络个体。针对随机出现的观测任务请求导致历史学习策略失效,通过迁移学习将历史学习策略转换为当前初始策略,保证规划质量前提下加快多星协同任务规划速度。仿真实验及分析结果表明本文算法对动态随机出现的任务请求有良好的适应性。 相似文献
3.
为提高在轨微小卫星的使用效能及生存能力,提出一种微小卫星低可观测外形飞行姿态规划算法.根据微小卫星雷达散射截面(RCS)、轨道及雷达威胁特性,建立了可进行长时间内最佳飞行姿态规划的数学模型,设计了低计算复杂度的链表式个体结构及进化规划策略,并实现了算法对高威胁区优化规划的能力.同时,算法低迭代步长下的快速收敛特性以及进... 相似文献
4.
5.
6.
非合作航天器姿态接管无辨识预设性能控制 总被引:1,自引:1,他引:0
在对非合作航天器进行姿态接管控制时,可能面对目标航天器参数未知、构型改变引起的不确定性及目标施加的非合作控制输入等挑战。针对上述问题提出了一种基于预设性能控制理论的非合作航天器姿态接管控制方法。首先,建立了姿态跟踪运动的非奇异拉格朗日型模型;然后,利用跟踪微分器构造不包含角速度信息的广义状态量,设计无需参数辨识的非奇异预设性能控制器,并证明了系统状态变量的有界性和控制系统在预设的性能指标以内。最后,通过数值仿真验证了所提出方法的有效性及其对时变参数不确定性和非合作控制输入的鲁棒性。 相似文献
7.
全天时星跟踪器与捷联惯导组成的惯性/天文组合导航系统具有精度高、自主性强等优点,在飞机、无人机、船舶等领域具有广泛的应用前景。组合导航系统长时间工作中力热变化导致安装矩阵漂移进而影响导航系统精度,全天时星跟踪器由于天空光影响视场小,一次只能观测一颗恒星,无法根据一副星图直接进行安装阵估计。提出了一种基于Levenberg-Marquart (L-M)算法的捷联惯性/天文组合导航系统安装阵在线快速高精度估计方法,利用捷联惯导姿态测量值,将不同时刻的观测星矢量转移到同一时刻同一坐标系中,构造多颗观测星的观测矢量误差与导航星矢量最小二乘目标函数,利用自适应步长的L-M算法对其进行迭代求解,实时得到系统安装矩阵的变化量。试验结果表明,使用该方法后星跟踪器在捷联惯导本体坐标系的输出恒星投影矢量精度提升了1倍以上,在线估计时间优于5 ms,满足用户实时性和高精度要求。 相似文献
8.
9.
10.
为了降低弹载星惯组合(Stellar-INS)飞行中段对调姿观星的要求,提高星惯组合姿态精度,提出了大视场(LFOV)星惯组合深度融合导航方法。小视场(NFOV)星敏感器输出星矢量为主,大视场星敏感器可同时输出姿态和星矢量信息,分别推导了基于星敏感器输出姿态和星矢量信息的观测方程,分析了星矢量和姿态观测方法之间的关联性。建立了包含星惯安装误差、陀螺误差以及初始平台误差角的星惯组合全误差项模型,基于线性卡尔曼滤波给出了深度融合导航方法。开展了数学仿真验证,分析了不同调姿观星路径约束下,大/小视场星惯组合性能差异。结果表明,大视场星惯组合深度融合导航方法不仅可以降低调姿观星约束要求,还可以实现组合姿态性能提升。 相似文献
11.
针对多无人机绳索悬挂协同搬运跟踪控制问题,设计了一种新的固定时间协同跟踪控制算法。首先,通过旋量分析,计算系统不同状态下的有效旋量空间,并根据静力学平衡计算系统在有效旋量空间约束下的拉力容许裕度。其次,在保证绳索张紧以及最大拉力约束的条件下,基于微分平坦性以及绳索拉力优化分配算法,规划编队的期望跟踪轨迹。然后,基于Udwadia-Kalaba方程建立系统动力学模型,设计了连续的基于类超扭滑模和积分滑模的鲁棒控制项,以补偿系绳拉力给无人机造成的扰动,并设计了基于双极限齐次性原理的固定时间无人机协同外环位置控制器。针对无人机内环姿态稳定控制,设计了固定时间姿态稳定控制器。仿真结果表明,绳索拉力满足张紧和最大拉力约束,且设计的固定时间协同跟踪控制算法保证了系统在固定时间内稳定跟踪期望轨迹。 相似文献
12.
《中国航空学报》2016,(3):831-842
During radial–axial ring rolling process,cooperative strategy of the radial–axial feed is critical for dimensional accuracy and thermo mechanical parameters distribution of the formed ring.In order to improve the comprehensive quality of the ring parts,response surface method(RSM) is employed for the first time to optimize the cooperative feed strategy for radial–axial ring rolling process by combining it with an improved and verified 3D coupled thermo-mechanical finite element model.The feed trajectory is put forward to describe cooperative relationship of the radial–axial feed and three variables are designed based on the feed trajectory.In order to achieve multiobjective optimization,four responses including thermo mechanical parameters distribution and rolling force are proposed.Based on the FEM results,RSM is used to establish a response model to depict the function relationship between the objective response and design variables.Through this approximate model,effects of different variables on ring rolling process are analyzed connectedly and optimal feed strategy is obtained by resorting to the optimal chart specific to a constraint condition. 相似文献
13.
14.
基于分支深度强化学习的非合作目标追逃博弈策略求解 总被引:2,自引:0,他引:2
为解决航天器与非合作目标的空间交会问题,缓解深度强化学习在连续空间的应用限制,提出了一种基于分支深度强化学习的追逃博弈算法,以获得与非合作目标的空间交会策略。对于非合作目标的空间交会最优控制,运用微分对策描述为连续推力作用下的追逃博弈问题;为避免传统深度强化学习应对连续空间存在维数灾难问题,通过构建模糊推理模型来表征连续空间,提出了一种具有多组并行神经网络和共享决策模块的分支深度强化学习架构。实现了最优控制与博弈论的结合,有效解决了微分对策模型高度非线性且难于利用经典最优控制理论进行求解的难题,进一步提升了深度强化学习对离散行为的学习能力,并通过算例仿真检验了该算法的有效性。 相似文献
15.
通过耦合Nash竞争对策和伴随方法来研究气动多目标优化问题,其中对策论是描述现实世界中包含有矛盾、冲突、对抗、合作等诸因素的数学模型的数学理论与方法。将对策论的方法应用于互为冲突的多目标气动优化设计中,寻找各冲突目标之间的平衡解。计算结果表明:Nash均衡论可以很好地处理多目标优化问题,并且能自然地运用于并行环境。 相似文献
16.
《中国航空学报》2020,33(11):2907-2920
This paper investigates a time-varying anti-disturbance formation problem for a group of quadrotor aircrafts with time-varying uncertainties and a directed interaction topology. A novel Finite-Time Convergent Extended State Observer (FTCESO) based fully-distributed formation control scheme is proposed to enhance the disturbance rejection and the formation tracking performances for networked quadrotors. By adopting the hierarchical control strategy, the multi-quadrotor system is separated into two subsystems: the outer-loop cooperative subsystem and the inner-loop attitude subsystem. In the outer-loop subsystem, with the estimation of disturbing forces and uncertain dynamics from FTCESOs, an adaptive consensus theory based cooperative controller is exploited to ensure the multiple quadrotors form and maintain a time-varying pattern relying only on the positions of the neighboring aircrafts. In the inner-loop subsystem, the desired attitude generated by the cooperative control law is stably tracked under a FTCESO-based attitude controller in a finite time. Based on a detailed algorithm to specify the cooperative control protocol, the feasibility condition to achieve the time-varying anti-disturbance formation tracking is derived and the rigorous analysis of the whole closed-loop multi-quadrotor system is given. Some numerical examples are conducted to intuitively demonstrate the effectiveness and the improvements of the proposed control framework. 相似文献
17.
《中国航空学报》2021,34(3):176-186
This paper investigates the coordinated attitude control problem for flexible spacecraft formation with the consideration of actuator configuration misalignment. First, an integral-type sliding mode adaptive control law is designed to compensate the effects of flexible mode, environmental disturbance and actuator installation deviation. The basic idea of the Integral-type Sliding Mode Control (ISMC) is to design a proper sliding manifold so that the sliding mode starts from the initial time instant, and thus the robustness of the system can be guaranteed from the beginning of the process and the reaching phase is eliminated. Then, considering the nominal system of spacecraft formation based on directed topology, an attitude cooperative control strategy is developed for the nominal system with or without communication delay. The proposed control law can guarantee that for each spacecraft in the spacecraft formation, the desired attitude objective can be achieved and the attitude synchronization can be maintained with other spacecraft in the formation. Finally, simulation results are given to show the effectiveness of the proposed control algorithm. 相似文献
18.
19.
从高超声速飞行器集群"探测-打击-评估"一体化任务需求出发,针对多滑翔飞行器时间协同再入轨迹规划问题进行研究,提出集群再入的协同形式及轨迹规划方案,基于改进序列凸化算法解决了再入总飞行时间的精确控制问题,从而实现滑翔段时间协同。首先,给出了滑翔飞行器集群的协同策略,将求解模型转化为协同时间的确定、协同时间约束下的轨迹规划子问题。将模型中的时间项误差等加入罚函数,提高了协同轨迹求解可行性。引入飞行路径角预设剖面作为软约束,并通过罚函数与信赖域自适应调整,以避免轨迹求解时的振荡问题,提高了序列凸化算法的收敛性。以CAV-H飞行器模型为例验证了算法的有效性,仿真结果表明,所提算法对初值的敏感性低,求解得到的再入总时间可调范围与伪谱法一致,轨迹规划结果的平滑性及计算时间均优于伪谱法。 相似文献
20.
针对多枚飞行器协同拦截同一目标的问题,在最优控制与时间调整相结合的基础上,设计了一种带有时间约束与角度约束的协同制导律。首先,在初始时刻(或中段制导结束时刻),根据初始状态及终端角度约束情况,以指定策略为编队中的各飞行器分配拦截角度。其次,采用线性化最优控制的设计方法,解算带有拦截角度约束的最优导引指令。最后,在求解针对运动目标的飞行器剩余时间估计的基础上,根据一致性的方法推导时间调整项的导引指令。仿真结果表明,在典型背景下,设计的制导律能够使多枚飞行器以特定的编队构型协同拦截同一目标,从而有效提高拦截概率。 相似文献