期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	1篇
免费	1篇

专业分类

航空	1篇
综合类	1篇

出版年

2022年	1篇
2006年	1篇

排序方式： 共有2条查询结果，搜索用时 46 毫秒

基于情感的控制策略及其在移动机器人导航中的应用

张惠娣刘士荣《南京航空航天大学学报》2006,38(Z1):74-78

提出了一种基于情感的移动机器人导航控制策略。根据机器人的导航任务设计了一个情感系统,并与基于行为的机器人系统相结合,构造了基于情感的行为协调控制策略。仿真和比较研究结果表明该控制策略能有效地提高机器人在未知环境中自主导航的能力。相似文献

基于信任域策略优化的末制导控制量学习算法CSCD

下载免费PDF全文

刘士荣王天一刘扬《导航定位与授时》2022,(6):77-84

近年来,深度强化学习在解决序列决策问题上取得了很大进展,无模型强化学习算法在与环境不断交互的过程中学习策略,不需要提前对环境建模,使其适用于许多问题。针对以往使用强化学习进行末制导策略学习的训练不稳定问题,使用信任域策略优化算法直接学习末制导控制量,同时设计了一种新颖的奖励函数,可以提高训练稳定性和算法性能。在二维环境下进行了实验,结果表明,该算法具有良好的训练稳定性,并可以达到很好的命中效果。相似文献