排序方式: 共有5条查询结果,搜索用时 0 毫秒
1
1.
2.
对深度确定性策略梯度算法训练智能体学习小型无人飞行器的飞行控制策略进行了探索研究。以多数据帧的速度、位置和姿态角等信息作为智能体的观察状态,舵摆角和发动机推力指令作为智能体的输出动作,飞行器的非线性模型和飞行环境作为智能体的学习环境。智能体在与环境交互过程中除了获得包含误差信息的密集惩罚外,也有达成一定目标的稀疏奖励,该设计有效提高了飞行数据的样本多样性,增强了智能体的学习效率。最后智能体实现了从位置、速度和姿态角等信息到控制量的端到端飞行控制,并进行了变航迹点、模型参数拉偏、注入扰动和故障条件下的飞行控制仿真,结果表明智能体除了能有效完成训练任务外,还能应对多种训练时未学习的飞行任务,具有优秀的泛化能力和鲁棒性,该方法具有一定的研究价值和工程参考价值。 相似文献
4.
考虑同时存在未知时延及随机丢包的飞行器网络环境,研究了飞行器网络控制系统的鲁棒故障检测问题。将未知时延及随机丢包的影响转变为未知扰动输入,建立飞行器网络控制系统的统一数学模型,同时考虑残差对故障的灵敏性和对未知扰动的鲁棒性,利用模型参考的思想,将故障检测问题分解为最优残差模型设计及鲁棒跟踪问题两部分,利用多目标优化方法给出最优残差模型的求解条件,并以线性矩阵不等式的方式给出鲁棒跟踪问题的存在条件,数值仿真表明,所提方法能有效抑制时延及丢包的影响,并能快速有效地检测出更小故障,验证了方法的有效性和优越性。 相似文献
5.
1