期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	2篇
免费	2篇

专业分类

航空	1篇
航天技术	1篇
航天	2篇

出版年

2021年	2篇
2019年	1篇
2017年	1篇

排序方式： 共有4条查询结果，搜索用时 218 毫秒

基于强化学习的航空器机场智能静态路径规划

疏利生李桂芳嵇胜《航空工程进展》2021,12(3):65-70

随着人工智能迅速发展以及“智慧机场”的提出,研究人工智能在机场如何有效地辅助机场管制人员,驾驶员指挥航空器在地面滑行具有重要意义。本文提出一种基于强化学习的滑行路径规划方法,构建航空器机场地面强化学习移动模型,并以海口美兰机场为案例采用 Python 内置工具包 Tkinter 进行场面仿真;在此基础上,考虑机场航空器滑行规则,采用 Off-Policy 中 Q-Learning 算法求解贝尔曼方程,实现航空器在 Model-based 环境中进行静态路径规划。结果表明：本文所提方法能够实现停机位到跑道出口智能静态路径规划相似文献

基于强化学习的软体机构抓捕策略研究 总被引：1，自引：0，他引：1

下载免费PDF全文

张文奇陈萌谷程鹏《上海航天》2019,36(5):63-70, 82

大型空间结构建造与维护、失效卫星检测与维修、轨道碎片清除等已成为航天技术发展亟待解决的现实问题。针对传统空间捕获机构质量惯量大、末端抓取精度要求高、抓捕对象适用范围窄不足等,创新性地提出基于IPMC(ion-exchange polymer metal composite)功能复合材料的多自由度仿生软体新型抓捕机构,同时基于强化学习算法提出多模态信息融合的抓捕操作强化学习策略,从而提升抓捕机构空间捕获的成功率,为空间抓捕技术的智能化发展提供新思路。相似文献

基于Q-Learning算法和神经网络的飞艇控制

总被引：1，自引：1，他引：0

聂春雨祝明郑泽伟武哲《北京航空航天大学学报》2017,43(12):2431-2438

针对现代飞艇控制中动力学模型不确定性带来的系统建模和参数辨识工作较为复杂的问题,提出了一种基于自适应建模和在线学习机制的控制策略。设计了一种在分析实际运动的基础上建立飞艇控制马尔可夫决策过程(MDP)模型的方法,具有自适应性。采用Q-Learning算法进行在线学习并利用小脑模型关节控制器(CMAC)神经网络对动作值函数进行泛化加速。对本文方法进行仿真并与经过参数整定的PID控制器对比,验证了该控制策略的有效性。结果表明,在线学习过程能够在数小时内收敛,通过自适应方法建立的MDP模型能够满足常见飞艇控制任务的需求。本文所提控制器能够获得与PID控制器精度相当且更为智能的控制效果。相似文献

基于Q-Learning的深度神经网络自适应退避策略

下载免费PDF全文

毛中杰俞晖麻智超王政《遥测遥控》2021,42(1):19-25

针对无人机自组织网络,结合Q-Learning和深度神经网络,提出一种自适应退避策略,以提高基于竞争的MAC协议通信性能.以Matlab为仿真平台,仿真比较了自适应退避策略与二进制指数退避策略的性能. 相似文献