排序方式: 共有18条查询结果,搜索用时 15 毫秒
1.
2.
为了克服深度强化学习训练时间长、收敛速度慢的问题,针对密集动态障碍环境下的无人机(UAV)路径规划,引入了增量式发育知识库,对深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)算法进行改进。首先,根据模糊匹配的思想建立威胁模式知识库,将飞行过程中遇到的密集动态障碍作为知识进行增量式存储,避免对相似障碍环境的重复训练。其次,在底层DDPG算法规划安全航路的基础上构建避障策略知识库,根据威胁模式直接输出避障策略,缩短训练时间。最后,搭建发育式的威胁-避障映射关系,实现“线上实时避障,线下自主寻优”,不断提升UAV避障性能。对比实验结果表明,所提方法能极大提高DDPG训练效率,满足UAV在密集动态障碍环境中实时避障的需求。 相似文献
3.
4.
5.
对无人机避开障碍物这一热点问题展开了研究。在极坐标系下,基于无人机与障碍物之间的几何关系,建立了无人机与障碍物之间的运动学方程。通过设计滑模变结构有限时间收敛制导律,使连接无人机与避障点的视线角速率快速收敛到零,相对速度方向收敛到期望的避障方向,保证了无人机能够顺利避开运动障碍物。通过有限时间收敛分析,得到了相对速度收敛到期望的避障方向时间与制导律参数的表达式。通过选择合适的参数,可使收敛时间小于到达避障点的时间,保证了避障的完成,也确定了制导律参数的取值范围。最后对设计的避障算法进行了仿真,仿真结果验证了算法的有效性。 相似文献
6.
为解决多机编队目标跟踪过程中存在的机间通信和控制更新频繁的问题,提出了一种具有事件触发机制的多机编队目标跟踪控制算法。首先,给出了一种具有事件触发策略的编队队形描述与目标跟踪一体化算法,简化了算法设计的复杂度,并使触发机制的工作过程更加直观;其次,给出了分布式目标跟踪控制律,并仅利用状态估计信息设计了事件触发函数,使无人机间通信与控制更新问题转换为判别触发函数的取值问题,同时设计了最小触发间隔系数,避免了可能存在的"Zeno行为";最后,以编队不同的运动模式对算法进行了仿真验证。研究结果表明:所提算法能使无人机编队在机间通信与控制更新次数明显减少的情况下跟踪上目标。 相似文献
7.
基于编队通信拓扑的网络复杂性,提出了一种多智能体系统最小刚性编队通信拓扑生成算法。首先基于刚度矩阵生成最小刚性编队通信拓扑的方式,找出智能体编队的最小刚性通信拓扑集;然后从降低通信消耗等方面建立网络复杂性评价指标,采用熵权法对各指标权重进行求解,给出网络复杂性的计算方法;基于此评价指标,在最小刚性通信拓扑集中找出网络复杂性最小的编队通信拓扑。仿真结果表明,该算法能有效减少编队通信拓扑网络复杂性,简化通信拓扑结构。 相似文献
8.
针对带未知参数且执行重复任务的机械臂,提出一种自适应迭代学习控制算法。为了克服因重置精度低带来的重置误差,引入了终态滑模和初始状态修正吸引子,实现了跟踪误差在有限时间收敛于0,并通过迭代轴上的自适应算法来调节控制器参数。理论证明了跟踪误差的收敛性和系统中所有信号的有界性,仿真结果验证了算法的有效性。 相似文献
9.
10.