首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 297 毫秒
1.
针对强化学习策略由仿真环境向实际迁移困难的问题,以提高无人机采用无深度信息单目视觉时的行人规避能力为目标,提出一种基于异步深度神经网络结构的跨传感器迁移学习方法。首先,在仿真环境中仅使用虚拟单线激光雷达作为传感器,通过基于确定性策略梯度(DDPG)的深度强化学习方法,训练得到一个稳定的初级避障策略。其次,用单目摄像头和激光雷达同步采集现实环境中的视觉和深度数据集并逐帧绑定,使用上述初级避障策略对现实数据集进行自动标注,进而训练得到无需激光雷达数据的单目视觉避障策略,实现从虚拟激光雷达到现实单目视觉的跨传感器迁移学习。最后,引入YOLO v3-tiny网络与Resnet18网络组成异步深度神经网络结构,有效提高了存在行人场景下的避障性能。  相似文献   

2.
针对多无人机任务决策方法研究中传统优化算法难以在短时间内得到期望结果的问题,基于深度强化学习提出一种无人机多智能体深度确定性策略梯度(MADDPG)算法,通过允许无人机在学习时使用全局信息,在应用决策的时候只使用局部信息的方法,从网络结构、状态空间、动作空间和奖励函数设计了MADDPG算法的模型结构。最后通过仿真实验,并对比深度确定性策略梯度(DDPG)算法,验证了本文提出的MADDPG算法在保证精度的基础上,学习速度大幅度提高,弥补了传统强化学习算法在多智能体领域的不足。  相似文献   

3.
研究基于深度学习技术的无人机航拍图像目标检测算法,首先介绍目标检测算法SSD(Single Shot MultiBox Detector),并对其特征提取网络进行改进,采用稠密特征提取网络替换原网络的主干特征提取网络,提高算法的特征提取能力,从而提升了算法的检测精度。针对网络实时性问题,在算法中引入分组卷积,极大地减少了网络参数量,提升了网络推理速度。为解决训练中出现的正负样本不均衡问题,利用焦点损失(Focal Loss)改进了原算法的损失函数,进一步提升了网络的收敛速度和精度。最后,通过仿真验证了改进算法在目标检测精度上的优越性。  相似文献   

4.
徐帷  卢山 《宇航学报》2019,40(4):435-443
针对目标特性未知的在轨操作环境,研究了典型空间操作机械臂的路径规划策略。采用Sarsa(λ)强化学习方法实现目标跟踪及避障的自主路径规划与智能决策,该方法将机械臂系统的每节臂视为一个决策智能体,通过感知由目标偏差和障碍距离程度组成的二维状态,设计符合人工经验的拟合奖赏函数,进行各臂转动动作的强化训练,最终形成各智能体的状态-动作值函数表,即可作为机械臂在线路径规划的决策依据。将本方法应用于多自由度空间机械臂路径规划任务,仿真结果表明新算法能在有限训练次数内实现对移动目标的稳定跟踪与避障,同时各智能体通过学习所得的状态-动作值函数表,具备较强的后期在线自主调整能力,从而验证了算法较强的鲁棒性和智能性。  相似文献   

5.
针对大气层内高速机动目标的拦截问题,提出了一种基于双延迟深度确定性策略梯度(TD3)算法的深度强化学习制导律,它直接将交战状态信息映射为拦截弹的指令加速度,是一种端到端、无模型的制导策略。首先,将攻防双方的交战运动学模型描述为适用于深度强化学习算法的马尔科夫决策过程,之后通过合理地设计算法训练所需的交战场景、动作空间、状态空间和网络结构,并引入奖励函数整形和状态随机初始化,构建了完整的深度强化学习制导算法。仿真结果表明:与比例导引和增强比例导引两种方案相比,深度强化学习制导策略在脱靶量更小的同时能够降低对中制导精度的要求;具有良好的鲁棒性和泛化能力,并且计算负担较小,具备在弹载计算机上运行的条件。  相似文献   

6.
基于DDQN的运载火箭姿态控制器参数设计   总被引:1,自引:0,他引:1  
探索了利用深度强化学习算法训练智能体,以代替人类工程师进行火箭姿态控制器参数的离线设计方案。建立了多特征秒的火箭频域分析模型,选定了设计参数。选择深度强化学习算法中的双深度Q学习(Double Deep Q Network,DDQN)算法,通过记忆回放和时间差分迭代的方式让智能体在与环境交互过程中不断学习。设计了对应的马尔科夫决策过程模型,进行了智能体的训练和前向测试。结果说明该方法对于运载火箭姿控设计具有一定参考价值。  相似文献   

7.
针对复杂空间环境下进行遥操作的安全性问题,提出一种基于路径点的光滑虚拟管道快速生成算法,改进深度优先算法对虚拟管道进行静态规划,并给出动态修正算法,实现管道的动、静态避障。虚拟管道可为操作者提供视觉、触觉等反馈信息以调整自身操作。操作对象在管道内运动,能安全、快速地达到目标。相对于路径规划方式按指定轨迹避障,该方法提高了操作灵活性和效率。在CHAI 3D仿真平台下进行多组避障实验,验证了算法的有效性。  相似文献   

8.
基于时序逻辑的复杂环境下无人机运动规划算法   总被引:1,自引:0,他引:1       下载免费PDF全文
本文主要考虑基于时序逻辑的无人机运动规划问题。一般地,解决该问题的算法包括两个阶段:上层综合阶段生成一条可行的离散规划;低级综合阶段结合离散任务规划设计无人机的控制输入。但是当第一阶段失败时,即线性时序逻辑(LTL)任务在当前环境中无法实现时,我们希望系统能够进行一定的调整。本文提出了一种任务重规划算法,在深入理解模型检查原理的基础上,利用初始任务自动机生成一个松弛乘积自动机,进而获取有效的离散任务规划;同时设计一个自动机的权重函数,确保该规划在最小程度上违背初始任务所提出的约束。本文提出的重规划算法解决了时序逻辑在复杂环境中无法实现的难题,扩大了时序逻辑在无人机运动规划中的应用范围,同时增加了系统的鲁棒性。  相似文献   

9.
针对传统脉冲避障算法在航天器轨迹规划应用中存在对瞬时推力依赖性强且燃料消耗量大的问题,提出能量最优的连续动态避障算法。该算法首先基于线性相对运动方程与有限时间的能量最优模型,建立了相对运动能量最优模型,同时验证了模型最优性;其次将动态障碍物的 y 向运动误差偏移与正态分布概率引入避碰安全距离模型,修正了追踪航天器动态避障的范围,确定了安全距离矢量长度,增强了规避障碍的可靠性;最后通过障碍物速度矢量与追踪器航天器速度矢量夹角确定动态避障点方向,减少燃料消耗的同时提高了避障的有效性、准确性。通过仿真验证,该算法可以自适应选取规避障碍点,有效规避动态障碍;工质燃料消耗较小,有效延长航天器在轨寿命。  相似文献   

10.
郭行  符文星  付斌  陈康  闫杰 《宇航学报》2019,40(2):182-190
针对复杂动态环境下无人飞行器的动态障碍规避问题,基于合理假设建立了无人飞行器和动态障碍的运动学模型,并综合考虑无人飞行器飞行过程中的终端约束、控制输入约束、安全避障约束等,以能量最少为性能指标构建动态避障问题数学描述。之后,针对终端约束和控制输入约束,依据优化模型预测静态规划算法(OMPSP)生成初始轨迹;针对动态避障问题的不等式约束,引入松弛变量并结合滑模变结构控制方法设计松弛变量动力学,实现对一个、多个或同时多个动态障碍的安全规避;最后,依据有限时间微分动态规划(RHDDP)算法进行轨迹优化,获得满足上述各种约束并能规避动态障碍的近似最优轨迹。  相似文献   

11.
一种基于S-R-S构型特点的正交冗余机械臂避障规划方法   总被引:1,自引:0,他引:1  
针对正交冗余机械臂避障规划问题,提出了一种基于S-R-S构型特点的避障规划新方法。该方法将正交7自由度冗余机械臂构型等效为S-R-S(球副-转动副-球副)构型,并依据S-R-S构型特点将避障规划分为肘部笛卡尔位置规划、第2根臂杆规划、末端工具规划3个部分。引入Bézier曲线完成肘部和末端工具在球面的避障规划,第2根臂杆的避障规划依据避障最大运动能力调整完成。通过Schunk-Lwa4D正交冗余机械臂避障规划实验,验证了提出的基于S-R-S构型特点的避障规划新方法的有效性和可行性。  相似文献   

12.
多无人机协同任务分配问题是多无人机协同控制的关键.本文首先深入分析多无人机任务分配问题的特点,建立了扩展的混合整数线性规划(MILP)任务分配模型.其次,通过分析细菌觅食优化算法和粒子群优化算法的优缺点,提出一种具有较强全局搜索能力且收敛速度快的混合细菌觅食优化算法.最后将该算法应用于多无人机协同任务分配中并进行了仿真...  相似文献   

13.
针对嫦娥五号探测器(CE-5)开展基于深空网测量数据的定轨能力分析.首先从测量原理分析了深空网VLBI数据的误差源,然后利用CE-5的精密轨道评估了 VLBI数据的误差,最后基于实测数据与协方差分析理论,分析UXB与VLBI数据的定轨能力.结果表明:转移阶段,单独利用深空网测量数据可以获取优于1 km的转移轨道精度,标...  相似文献   

14.
羊帆  张国良  田琦  王保明 《宇航学报》2018,39(2):229-238
针对自由漂浮空间机器人(Free Floating Space Robot,FFSR)的避障规划与控制问题,提出一种FFSR的避障规划-跟踪一体化控制方法。首先,基于障碍物伪距离技术,采用FFSR逆几何模型求解期望末端位姿下的连杆伪距离估计值,进而通过求解非线性优化问题,获得FFSR避障期望轨迹。其次,将全局轨迹规划与局部在线避障相结合,辅以离散状态黎卡提方程(DSDRE)控制方法实现FFSR的避障规划-跟踪一体化控制。最后,采用6R空间机器人模型验证了所提方法的有效性。仿真结果表明,该方法能够实现FFSR的避障控制,有效克服了传统FFSR控制中末端轨迹规划与控制相分离的问题,提高了FFSR的环境适应性。  相似文献   

15.
陈华中 《遥测遥控》2020,41(5):36-41
针对伺服延迟造成目标丢失的问题,为了提高相控阵雷达的跟踪能力,提出一种机械式机动相控阵雷达的目标跟踪算法,并且给出了方法的处理流程和算法仿真。仿真结果表明,提出的目标跟踪算法具有较高的跟踪精度和较快的收敛速度,能够满足机动相控阵跟踪的实时性要求。  相似文献   

16.
蒋春蕾 《航天控制》2012,30(2):63-68
由于通信链路的随机时间延迟和星上传感器测量的预处理时间的不同等因素,导致在目标飞行器的测量中产生无序量测现象。为解决该问题,提出了一种基于扩展卡尔曼滤波的前向预测多步滞后无序量测处理算法。该算法首先采用扩展卡尔曼滤波算法估算出目标飞行器的状态方程和协方差方程,然后在滤波过程中利用前向滤波更新的方法,将协方差方程更新结果去相关后,累积到当前协方差方程滤波结果中,从而有效解决了目标飞行器测量中的无序量测问题。最后,将该算法与扩展卡尔曼滤波算法、丢弃算法进行了对比仿真。仿真结果表明,采用该算法处理目标飞行器的位置和飞行速度,得到的测量误差较小,在整个观测时间内,测量误差的收敛性较好,能够实现对目标飞行器的精确测量和跟踪。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号