首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   2篇
  免费   2篇
航空   1篇
航天技术   1篇
航天   2篇
  2021年   2篇
  2019年   1篇
  2017年   1篇
排序方式: 共有4条查询结果,搜索用时 218 毫秒
1
1.
随着人工智能迅速发展以及“智慧机场”的提出,研究人工智能在机场如何有效地辅助机场管制人员,驾驶员指挥航空器在地面滑行具有重要意义。本文提出一种基于强化学习的滑行路径规划方法,构建航空器机场地面强化学习移动模型,并以海口美兰机场为案例采用 Python 内置工具包 Tkinter 进行场面仿真;在此基础上,考虑机场航空器滑行规则,采用 Off-Policy 中 Q-Learning 算法求解贝尔曼方程,实现航空器在 Model-based 环境中进行静态路径规划。结果表明:本文所提方法能够实现停机位到跑道出口智能静态路径规划  相似文献   
2.
基于强化学习的软体机构抓捕策略研究   总被引:1,自引:0,他引:1       下载免费PDF全文
张文奇  陈萌  谷程鹏 《上海航天》2019,36(5):63-70, 82
大型空间结构建造与维护、失效卫星检测与维修、轨道碎片清除等已成为航天技术发展亟待解决的现实问题。针对传统空间捕获机构质量惯量大、末端抓取精度要求高、抓捕对象适用范围窄不足等,创新性地提出基于IPMC(ion-exchange polymer metal composite)功能复合材料的多自由度仿生软体新型抓捕机构,同时基于强化学习算法提出多模态信息融合的抓捕操作强化学习策略,从而提升抓捕机构空间捕获的成功率,为空间抓捕技术的智能化发展提供新思路。  相似文献   
3.
  总被引:1,自引:1,他引:0  
针对现代飞艇控制中动力学模型不确定性带来的系统建模和参数辨识工作较为复杂的问题,提出了一种基于自适应建模和在线学习机制的控制策略。设计了一种在分析实际运动的基础上建立飞艇控制马尔可夫决策过程(MDP)模型的方法,具有自适应性。采用Q-Learning算法进行在线学习并利用小脑模型关节控制器(CMAC)神经网络对动作值函数进行泛化加速。对本文方法进行仿真并与经过参数整定的PID控制器对比,验证了该控制策略的有效性。结果表明,在线学习过程能够在数小时内收敛,通过自适应方法建立的MDP模型能够满足常见飞艇控制任务的需求。本文所提控制器能够获得与PID控制器精度相当且更为智能的控制效果。  相似文献   
4.
针对无人机自组织网络,结合Q-Learning和深度神经网络,提出一种自适应退避策略,以提高基于竞争的MAC协议通信性能.以Matlab为仿真平台,仿真比较了自适应退避策略与二进制指数退避策略的性能.  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号