期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

共查询到19条相似文献，搜索用时 140 毫秒

赵启甄子洋龚华军曹红波李荣刘继承《北京航空航天大学学报》2023,(8):2137-2146

针对无人机编队中控制器设计需要基于模型信息，以及无人机智能化程度低等问题，采用深度强化学习解决编队控制问题。针对编队控制问题设计对应强化学习要素，并设计基于深度强化学习对偶双重深度Q网络（D3QN）算法的编队控制器，同时提出一种优先选择策略与多层动作库结合的方法，加快算法收敛速度并使僚机最终能够保持到期望距离。通过仿真将设计的控制器与PID控制器、Backstepping控制器对比，验证D3QN控制器的有效性。仿真结果表明：该控制器可应用于无人机编队，提高僚机智能化程度，自主学习保持到期望距离，且控制器设计无需模型精确信息，为无人机编队智能化控制提供了依据与参考。相似文献

基于深度强化学习的平流层浮空器高度控制

张经伦杨希祥邓小龙郭正翟嘉琪《北京航空航天大学学报》2023,(8):2062-2070

为研究基于深度强化学习的平流层浮空器高度控制问题。建立平流层浮空器动力学模型，提出一种基于深度Q网络（DQN）算法的平流层浮空器高度控制方法，以平流层浮空器当前速度、位置、高度差作为智能体的观察状态，副气囊鼓风机开合时间作为智能体的输出动作，平流层浮空器非线性动力学模型与扰动风场作为智能体的学习环境。所提方法将平流层浮空器的高度控制问题转换为未知转移概率下连续状态、连续动作的强化学习过程，兼顾随机风场扰动与速度变化约束，实现稳定的变高度控制。仿真结果表明：考虑风场环境对浮空器影响下，DQN算法控制器可以很好的实现变高度的跟踪控制，最大稳态误差约为10 m，与传统比例积分微分（PID）控制器对比，其控制效果和鲁棒性更优。相似文献

基于Q-Learning算法和神经网络的飞艇控制

总被引：1，自引：1，他引：0

聂春雨祝明郑泽伟武哲《北京航空航天大学学报》2017,43(12):2431-2438

针对现代飞艇控制中动力学模型不确定性带来的系统建模和参数辨识工作较为复杂的问题,提出了一种基于自适应建模和在线学习机制的控制策略。设计了一种在分析实际运动的基础上建立飞艇控制马尔可夫决策过程(MDP)模型的方法,具有自适应性。采用Q-Learning算法进行在线学习并利用小脑模型关节控制器(CMAC)神经网络对动作值函数进行泛化加速。对本文方法进行仿真并与经过参数整定的PID控制器对比,验证了该控制策略的有效性。结果表明,在线学习过程能够在数小时内收敛,通过自适应方法建立的MDP模型能够满足常见飞艇控制任务的需求。本文所提控制器能够获得与PID控制器精度相当且更为智能的控制效果。相似文献

基于深度增强学习的卫星姿态控制方法

王月娇马钟杨一岱王竹平唐磊《中国空间科学技术》2019,39(4):36

针对卫星在执行丢弃载荷或捕获目标等复杂任务时遭遇的姿态突然发生变化的问题,采用深度增强学习方法对卫星姿态进行控制,使卫星恢复稳定状态。具体来说,首先搭建飞行器的姿态动力学环境,并将连续的控制力矩输出离散化,然后采用Deep Q Network算法进行卫星自主姿态控制训练,以姿态角速度趋于稳定作为奖励获得离散行为的最优智能输出。仿真试验表明,面向空间卫星姿态控制的深度增强学习算法能够在卫星受到突发随机扰动后稳定卫星姿态,并能有效解决传统PD控制器依赖被控对象质量参数的难题。所提出的方法采用自主学习的方式对卫星姿态进行控制,具有很强的智能性和一定的普适性,在未来卫星执行复杂空间任务中的智能控制方面有着很好的应用潜力。相似文献

挠性航天器智能模糊控制算法

张恒浩唐庆博焉宁陈春燕郑正路《中国空间科学技术》2018,38(4):36-43

针对挠性航天器滑模变结构姿态控制器控制力矩的高频抖振问题,提出一种挠性航天器智能模糊控制算法。该算法使用模糊控制算法对航天器控制参数进行模糊化智能处理,能够有效改善控制器控制力矩的高频抖振问题。首先将模糊控制算法与滑模控制算法结合,根据切换面趋近律系数模糊化处理;然后应用连续饱和函数代替符号函数设计姿态控制器;最后通过算法到达滑模面的程度调整边界层厚度,在保证控制力矩不发生抖振情况的同时有效控制滑模面边界层的厚度。仿真结果证明,提出的智能模糊控制算法能够有效改善挠性航天器控制力矩的高频抖振问题,同时可以加快挠性航天器低阶模态振动曲线的收敛速度。相似文献

无刷直流电动机的新型自适应模糊神经控制 总被引：2，自引：0，他引：2

范正翘马书彤《北京航空航天大学学报》2000,26(1):34-37

为无刷直流电动机提出了一种自适应模糊神经控制方法.这是一种建立在开关控制、模糊控制和自适应控制相结合基础上的控制方法,并用神经网络实现了模糊控制器和自适应机构.在无刷直流电动机的双闭环调速系统中,电流控制器是PI控制器;转速控制器是由1个开关控制器和1个包括自适应机构在内的模糊控制器相结合组成的,且用1个3层前向神经网络离线学习实现了模糊控制器,学习算法采用的是改进的BP算法.用1个单神经元通过在系统运行过程中的动态学习实现了自适应机构,学习算法选用了有监督的Hebb学习算法.由电机所处的运行阶段决定哪一个控制器工作.此控制算法的仿真结果说明,它使系统具有良好的动、静态特性和自适应性. 相似文献

基于DM-DSC的舰载机着舰自动复飞控制算法

崔凯凯韩维刘玉杰刘洁褚达文崔荣伟《北京航空航天大学学报》2023,49(4):900-912

针对理想复飞轨迹已知条件下的舰载机自动复飞控制问题,提出一种基于偏差模型的动态面控制（DM-DSC）算法。基于Radau伪谱法给出了舰载机着舰的最优复飞轨迹;根据得到的最优复飞轨迹及其所对应的控制方案,分别给出了速度子系统和高度子系统的偏差控制模型和反演（Backstepping）控制器,并通过引入动态面结构来获得虚拟控制量的微分信号,避免了Backstepping控制律求解过程中的“微分膨胀”问题;考虑到气动参数的不确定性及舰尾流场的干扰,采用线性扩张状态观测器（LESO）对控制模型中的干扰项进行估计和补偿,并设计抗饱和辅助系统来抑制控制饱和的不利影响;最后,基于Lyapunov方法证明闭环系统信号的有界性。仿真结果表明：所提算法具有良好的控制性能。相似文献

基于改进优先经验回放的SAC算法路径规划

崔立志钟航董文娟《空间控制技术与应用》2023,(5):55-64

为解决智能体在复杂环境下的路径规划问题,提出一种基于改进优先经验回放方法的在线异策略深度强化学习算法模型.该模型采用柔性动作评价算法,通过设计智能体的状态空间、动作空间及奖励函数等实现智能体无碰撞路径规划;利用样本状态优先度与TD误差构建的样本混合优先度的离散度计算样本采样概率,进一步提出基于改进优先经验回放方法的柔性动作评价算法,提高模型学习效率.仿真实验结果验证了提出的改进柔性动作评价算法在各个参数配合下的有效性及改进优先经验回放方法在连续控制任务中模型学习效率的优越性. 相似文献

飞行器航迹倾角的自适应动态面控制 总被引：3，自引：0，他引：3

郭一刘金琨《北京航空航天大学学报》2013,39(2):275-279

针对飞行器纵向模型具有参数不确定性和外界干扰的特点,提出一种飞行器航迹倾角的自适应动态面控制方法.动态面控制方法通过引入一阶低通滤波器避免了传统反演设计存在的"微分爆炸"现象,采用自适应律对模型未知参数进行在线估计,并利用非线性阻尼项克服外界干扰.通过Lyapunov方法证明得出闭环系统半全局一致稳定,跟踪误差可通过调节控制器参数达到任意小.仿真结果表明:该方法能在简化控制设计过程的同时保证航迹倾角跟踪上预定轨迹,控制系统具有较强的自适应能力且对外界干扰具有一定的鲁棒性. 相似文献

10.

基于模糊参数优化的小行星软着陆控制方法研究 总被引：1，自引：1，他引：0

王茜茜谢慕君李元春《深空探测学报》2015,2(2):162-167

针对传统指数趋近律变结构控制中抖振的问题,设计出新型变速指数趋近律滑模控制器。基于小行星软着陆控制系统的动力学模型,推导出指数趋近律滑模控制器结构。通过实时分析运动点距离滑模面的位置及趋近速率,采用模糊参数优化策略动态调整切换增益,实现在滑模面外时加快响应速度并增强系统克服摄动及外部干扰能力,到达滑模面时柔化控制量以消除抖振的目的。通过Matlab仿真,结果表明变速趋近律不仅保证到达运动的快速性,且有效降低了系统抖振,具有良好的稳态性能。相似文献

11.

基于重复自抗扰控制的索网天线振动抑制

董雨桐王文豪马小飞刘磊《中国空间科学技术》2023,43(1):109-118

为解决索网天线在轨运行过程中的振动抑制问题,提出一种基于重复自抗扰复合控制器的主动振动控制方法。首先,使用有限元法建立天线型面的振动动力学模型,基于模态截断的方法对动力学模型进行降阶并转化为状态空间方程的形式。然后,基于能量最小化准则,使用遗传算法对传感器/作动器的位置进行优化。最后,设计了基于线性自抗扰控制的天线型面振动主动抑制算法,并在此基础上设计前馈重复控制算法,通过对反馈控制周期性误差的学习,提高控制器抑制周期性扰动的能力。仿真结果表明,相比无控状态时,所提出的控制方法可将型面扰动降低97.0%,振动抑制效果优于PID控制器。所设计的控制方法为天线型面的振动控制提供了一种新的技术手段。相似文献

12.

基于深度学习的非合作目标感知研究进展

下载免费PDF全文

何英姿杜航张海博《飞控与探测》2023,(1):01-14

近年来随着卷积神经网络的发展,基于深度学习的图像感知技术取得了巨大进展。深度学习算法不依赖于人工辅助设计标记、泛化能力强、检测精度高,在空间非合作目标智能感知领域引起了国内外学者的关注。本文分析了应用深度学习方法进行非合作目标智能感知的研究现状,并对他们进行分类介绍与总结。首先,总结了空间非合作目标感知的在轨应用情况和任务阶段规划,接着分析了非合作目标的结构特性和表面光照特性;其次梳理总结了建立非合作目标数据集的三种方法,分类归纳了非合作目标识别与非合作目标位姿检测的国内外研究进展;最后,分析了基于深度学习的非合作目标智能感知方法的关键问题与难点,并给出了后续研究的思路。相似文献

13.

一种柔性可展桁架结构的主动振动抑制技术 总被引：1，自引：0，他引：1

朱东方刘付成黄静孙禄君黄庭轩《飞控与探测》2019,(5):33-40

针对柔性可展桁架结构的主动振动抑制问题,提出一种采用作动执行机构的主动振动控制方法。首先基于模态综合方法建立智能柔性可展桁架结构的动力学模型,然后采用动态滑模控制律设计了主动振动控制器,并基于遗传算法对作动执行机构的布局配置进行优化,最后通过数学仿真验证,仿真结果表明了方法的有效性。相似文献

14.

产品协同设计中异构模型数据融合的有效策略

下载免费PDF全文

薛俊杰周军华施国强宋晓蒋炎红全红艳《北京航空航天大学学报》2022,48(6):995-1003

针对复杂产品设计中，不同设计工具产生的模型数据之间的融合问题，提出了一种工具间端到端的异构模型数据融合策略。利用数据库管理动态特性，通过模型信息共享，实现异构模型数据之间的融合。在OpenMBEE系统集成环境中，通过建模工具CREO二次开发，利用所提策略获取全生命周期设计中的动态模型属性信息，通过3D模型编辑及重用功能测试，验证了所提策略的有效性。利用自动获取可视化模型属性信息的智能算法，设计一种基于Transformer模型与双向长短期记忆(Bi-LSTM)模型相结合的模型属性智能提取算法，利用神经网络的多层感知特性，通过对模型中属性文本信息进行深度学习、特征分析，实现了对异构数据属性信息的自动提取功能。利用CAMEO建模工具设计的需求分析模型构建模型数据集，验证了智能模型信息自动提取功能的有效性。相似文献

15.

深空探测器动态约束规划中的外延约束过滤方法研究

姜啸徐瑞陈俐均《深空探测学报》2019,6(6):586-594

随着深空探测任务的增加以及星上科学任务的日益复杂,深空探测器自主任务规划与调度技术成为研究的热点。在深空探测器任务特点与系统约束分析的基础上,将智能规划理论与约束可满足技术相结合,研究多层约束规划模型中约束的动态特征,设计了基于动态约束表的外延约束快速过滤算法,根据领域信息中活动间的冲突性特征来对新加入的活动进行分类和一致性检查。仿真结果表明:提出的算法能够有效地降低约束处理中无效的约束检查次数,降低问题处理过程中的算法回溯,提高规划效率和成功率。相似文献

16.

基于深度强化学习的软件定义卫星姿态控制算法

许轲吴凤鸽赵军锁《北京航空航天大学学报》2018,44(12):2651-2659

深度强化学习（DRL）作为一种新型的基于机器学习的控制算法,在机器人和无人机等智能控制领域展现出了优异的性能,而卫星姿态控制领域仍然在广泛使用传统的PID控制算法。随着卫星的小型化、智能化以至软件定义卫星的出现,传统控制算法越来越难以满足姿态控制系统对适应性、自主性、鲁棒性的需求。因此对基于深度强化学习的姿态控制算法进行了研究,该算法使用基于模型的算法,比非基于模型的算法拥有更快的收敛速度。与传统控制策略相比,该算法无需对卫星的物理参数和轨道参数等先验知识,具有较强的适应能力和自主控制能力,可以满足软件定义卫星适应不同硬件环境,进行快速研发和部署的需求。此外,该算法通过引入目标网络和并行化启发式搜索算法之后,在网络精度和计算速度方面进行了优化,并且通过仿真实验进行了验证。相似文献

17.

基于大脑情感学习模型的转台伺服系统设计 总被引：1，自引：0，他引：1

甄子洋王道波王志胜《中国空间科学技术》2009,29(1):13

提出了基于大脑情感学习(Brain Emotional Learning,BEL)模型的高精度转台伺服系统智能控制方案。BEL模型是一种模拟哺乳动物大脑情感学习过程的仿生计算模型。设计了融合系统跟踪误差、控制输入等信息的BEL智能控制结构,通过选取不同的感官输入信号可获得不同的控制结构,采用联想学习方法在线学习BEL模型内部的节点权值来调节控制器参数,从而实现转台伺服系统的自适应跟踪控制。仿真和实验结果均表明,BEL智能控制器学习能力强,能抑制摩擦等非线性干扰因素,在实时控制系统中表现出较好的稳定性和较高的跟踪性能。相似文献

18.

基于自适应迭代的机器人曲面恒力跟踪

李琳肖佳栋张铁肖蒙《北京航空航天大学学报》2019,45(4):641-649

针对利用机器人进行打磨、抛光、去毛刺等场合时末端执行器对曲面工件轮廓跟踪时难以得到恒定接触力的问题,对机器人末端执行器和工件轮廓接触时的接触力进行研究,建立了实际跟踪过程中机器人末端执行器的接触力和已知传感器坐标系的映射关系,提出了一种基于自适应迭代学习算法的机器人力/位混合曲面恒力跟踪控制方法。该方法由两部分组成:基于机器人和环境接触时的阻抗模型设计了迭代学习控制律,在PD反馈控制的基础上通过迭代项克服机器人的未知参数和不确定性,并构建Lyapunov能量函数证明所提控制律的收敛性;将迭代学习控制律和力/位混合曲面恒力跟踪控制方法结合起来设计了用于曲面工件轮廓跟踪的控制方法。实验结果显示,经过15次迭代,接触力的波动范围逐渐变小并稳定在±3 N之内,验证了所提方法的有效性。相似文献

19.

基于DDPG算法的变体飞行器自主变形决策

下载免费PDF全文

桑晨郭杰唐胜景王肖王子瑶《北京航空航天大学学报》2022,48(5):910-919

针对变体飞行器的自主变形决策问题，提出了一种基于深度确定性策略梯度(DDPG)算法的智能二维变形决策方法。以可同时变展长及后掠角的飞行器为研究对象，利用DATCOM计算气动数据，并通过分析获得变形量与气动特性之间关系；基于给定的展长和后掠角变形动力学方程，设计DDPG算法学习步骤；针对对称和不对称变形条件下的变形策略进行学习训练。仿真结果表明:所提算法可以快速收敛，变形误差保持在3%以内，训练好的神经网络提高了变体飞行器对不同飞行任务的适应性，可以在不同的飞行环境中获得最佳的飞行性能。相似文献