首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 765 毫秒
1.
针对多智能体系统目标围捕问题,提出了基于强化学习的目标围捕控制方法。首先,对多智能体系统进行马尔可夫博弈建模,设计能够控制系统到期望围捕状态并满足避障要求的势能函数,将模型控制与强化学习原理结合,利用势能模型引导的改进多智能体强化学习算法进行围捕。其次,在已有势能模型的基础上建立跟踪围捕和环航围捕2种围捕策略。前者通过设计速度势能函数实现多智能体一致跟踪。后者加入虚拟环航点,设计虚拟环航点势能函数实现期望环航。最终,仿真验证了多智能体强化学习围捕控制策略的有效性。  相似文献   

2.
符小卫  王辉  徐哲 《航空学报》2022,(5):530-543
针对多无人机协同对抗快速目标的追逃博弈问题,研究了多无人机的协同追捕策略。基于解耦多智能体深度确定性策略梯度算法DE-MADDPG研究了多无人机协同对抗快速目标的追捕策略,设计了多无人机协同追捕的全局奖励和局部奖励两种奖励函数,训练后的多无人机能够有效地执行协同追捕任务。通过设置快速目标的多种逃逸控制策略,仿真验证了所设计的方法能够利用追捕无人机的数量优势,通过协作完成对快速目标的协同围捕,并且通过比较,验证本文所提出的算法相比MADDPG算法更快地取得了收敛效果。  相似文献   

3.
基于“虚拟范围”的多机器人围捕算法   总被引:3,自引:0,他引:3  
王巍  宗光华 《航空学报》2007,28(2):508-512
 讨论了基于SQL Server数据库的栅格地图建立方法。介绍了一种建立在势场法和栅格地图上的室外多机器人路径规划方法,分析了在已知地图中应用势场法进行路径规划时的路径死点和规划失败问题,并给出了解决方法。以势场栅格法为基础探讨了多机器人协作围捕动态目标的策略。在围捕算法中,根据室外机器人工作环境的特点,提出了“虚拟范围”的概念,以减少动态规划次数,提高围捕速度。介绍了机器人以“虚拟范围”为基准,在各种状态之间的转换机制。利用基于无线局域网的室外多机器人系统进行了试验,试验表明引入“虚拟范围”之后能有效缩短围捕时间,并且存在最短时“虚拟范围”。
  相似文献   

4.
目前游戏中NPCs多目标行为进化是一个非常复杂的问题。对此建立了NPCs多目标优化的数学模型,并提出了一种NSGA-Ⅱ的改进算法——INSGA-Ⅱ。该算法在进行精英选择时,采用了基于K-均值聚类的方法联合了不同等级之间的个体进行集合划分,然后从不同的集合中选择下一代个体,从而更好地保持了种群的多样性。通过实例比较证明,在玩家和NPCs作战的游戏场景下,INSGA-Ⅱ能够得到NPCs复杂多目标控制问题的Pareto最优解,而且比NSGA-Ⅱ表现出更好的收敛性和多样性。  相似文献   

5.
基于增强型比例导引律和分布式网络同步理论,设计了一类攻击机动目标的多导弹系统分布式协同制导律。该制导律由各导弹本地制导律和分布式协同导引策略两部分组成:本地制导律为增强型比例导引律,进一步利用代数图论和非线性系统一致性理论,得到基于邻接个体信息交互的分布式协同制导律,实现多导弹对目标的同时协同攻击;该分布式协同制导律仅需视距内各相邻导弹间互相传输各自的状态信息,算法具有较低的通信代价和较好的可扩展性。最后给出了相关数值仿真算例,仿真结果验证了算法的有效性。  相似文献   

6.
协同进化方法求解多中心卫星任务规划问题   总被引:1,自引:0,他引:1  
王冲  景宁  李军  王钧 《航空学报》2010,31(9):1832-1840
 在分析多卫星中心内部特点及中心间关系的基础上建立了多中心协同规划问题(MCCOPP)的数学模型,提出了解决该问题的多中心合作协同进化规划算法(MCCCSPA)。MCCCSPA基于分治-合作策略,根据中心数目以及观测目标集合特点将观测目标分解分配至各中心;提出等长扩展二进制染色体编码方式有效表达问题的解,便于个体的交叉、变异、合作操作;并综合多中心个体代表合作求解本中心个体适应值;其中交叉、变异、合作算子在确保可行解的前提下保证各中心子种群的多样性、加快收敛速度。仿真实验及分析结果表明:该方法能够有效解决多中心协同的卫星任务规划问题。  相似文献   

7.
应用多目标遗传算法的叶栅气动优化设计   总被引:9,自引:2,他引:7  
采用Pareto排名策略和共享小生境技术, 实现遗传算法的多目标优化设计.叶栅的气动性能通过求解二维Navier-Stokes方程获得.本文中压气机叶栅的多目标优化确定为在给定条件下同时追求高增压比和低总压损失系数.优化设计获得的Pareto解集显示出本文发展的优化设计平台能够较好的实现多目标的气动优化设计.   相似文献   

8.
针对多目标柔性工艺规划和调度集成问题,提出基于免疫遗传算法的多目标柔性工艺与调度集成求解方法。首先建立多目标柔性工艺规划和调度集成模型;引入决策者的模糊偏好信息实现对多个优化目标的决策;提出了基于自适应策略的免疫遗传算法,通过实例验证了方法的有效性,并与遗传算法和免疫遗传算法进行对比分析证明了方法的优越性。  相似文献   

9.
提出了一种多动态目标的监控模型,设计了目标监控优先级的计算方法和动态扫描队列的实现算法。并利用粗糙集理论的约简算法求得最小目标监控规则集,实现了仅利用单个PT(pan-tilt)摄像机对多个动态目标的实时监控。所进行的实际机器人动态环境实验,验证了提出方法的有效性和实用性。通过对实际和计划监控几率的比值分析说明了监控策略的合理性。  相似文献   

10.
卫星星座优化设计与直接部署卫星或普通迭代计算后部署卫星等方法不同,目的 是在有限的资源中达到更好的星座观测效果.通过使用遗传算法(Genetic Algorithm),在卫星星座构型模型的基础上,得到星座种群内对目标观测实效性较强、重访周期较短的卫星个体,并使用较优的卫星个体生成Walker星座组网,实现了生成的星座对目标区域的高精度观测与覆盖.这种方法避免了复杂的计算与主观上的加权计算,在经济成本和观测效果相互制约的前提下,得到了更加高效的卫星星座构型设计策略.将此优化设计策略用于选定的卫星星座构型中,通过仿真实验表明,基于遗传算法优化后的"深圳一号"卫星星座相较于其优化前的部署,其对目标区域及全球区域的整体观测性能提升了90%以上.  相似文献   

11.
万文娅  孙冲  袁建平 《航空学报》2020,41(12):324041-324041
针对现有空间非合作目标抓捕中存在无固定抓捕点以及待抓捕目标存在动态性等问题,提出了一种"主-从"式多指包络抓捕路径设计算法。首先,为了降低多指包络构型设计中的自由度,将多指机构分为一根主手指和其余从手指两类。然后,为了实现对具有动态性的空间非合作目标的抓捕,采用误差跟踪控制方法使主手指的基关节与包络点之间的运动保持同步。接着,引入单向距离的概念衡量主手指构型和包络边相似度,并利用快速搜索随机树算法寻找使得单向距离最小的主手指关节角取值。进一步,根据多指机构的结构模型,确定其余从手指的构型。最后,根据包络条件选择能够约束住空间非合作目标运动的有效包络构型。通过对可以简化为扁平型的空间非合作目标和一般性三维空间非合作目标这两类目标的包络抓捕仿真可以得出,所设计的算法可适用于一般性空间非合作目标的包络抓捕,同时计算复杂度也大大降低。  相似文献   

12.
《中国航空学报》2020,33(3):1093-1106
The rotational motion of a tumbling target brings great challenges to space robot on successfully capturing the tumbling target. Therefore, it is necessary to reduce the target’s rotation to a rate at which capture can be accomplished by the space robot. In this paper, a detumbling strategy based on friction control of dual-arm space robot for capturing tumbling target is proposed. This strategy can reduce the target’s rotational velocity while maintaining base attitude stability through the establishment of the rotation attenuation controller and base attitude adjustment controller. The rotation attenuation controller adopts the multi-space hybrid impedance control method to control the friction precisely. The base attitude adjustment controller applies the dual-arm extended Jacobian matrix to stabilize the base attitude. The main contributions of this paper are as follows: (1) The compliant control method is adopted to achieve a precise friction control, which can reduce the target angular velocity steadily; (2) The dual-arm extended Jacobian matrix is applied to stabilize the base attitude without affecting the target capture task; (3) The detumbling strategy of dual-arm space robot is designed considering base attitude stabilization, realizing coordinated planning of the base attitude and the arms. The strategy is verified by a dual-arm space robot with two 7-DOF (degrees of freedom) arms. Simulation results show that, target with a rotation velocity of 20 (°)/s can be effectively controlled to stop within 30 s, and the final deflection of the base attitude is less than 0.15° without affecting the target capture task, verifying the correctness and effectiveness of the strategy. Except to the tumbling target capture task, the control strategy can also be applied to other typical on-orbit operation tasks such as space debris removal and spacecraft maintenance.  相似文献   

13.
Defending a Moving Target Against Missile or Torpedo Attack   总被引:4,自引:0,他引:4  
Problems involving kinematics of a counterweapon intercepting an attacking missile are well known. However, when the attacker's target, the counterweapon's launch platform, is moving, the problem generally becomes amenable only to trajectory simulation. Such may be the case in defense against torpedo attack against a ship and other situations involving the use of antimissile missiles. This paper derives the kinematic relations among the three bodies (missile, target, and counterweapon) in closed form under the asymptotic approximation of constant-bearing trajectories (collision courses). It is shown that the defending target, even if moving, can still determine the optimum course for its counterweapon when range and speed of the attacking vehicle are unknown. A simple relation is derived for the ratio between the attacker-target range (and time to impact) at counterweapon launch and the range at interception of the attacker by the counterweapon. Normalized curves are presented for some representative cases of defense by a counterweapon of known speed against a torpedo or missile attack on a moving target. The equations are shown to reduce to the familiar form for a stationary target.  相似文献   

14.
一种非线性末制导系统模型的精确线性化   总被引:1,自引:0,他引:1  
曹光前 《飞行力学》2000,18(2):85-88
针对未来高机动目标的拦截 ,运用非线性系统几何理论中的精确线性化方法 ,设计了一种空空导弹非线性末制导系统加速度指令。假设目标做逃逸机动 ,弹体 -自动驾驶仪响应用一个二阶环节描述 ,建立了导弹目标三维相对运动方程。根据终端约束直接选取系统输出阵 ,经动态反馈线性化 ,将非线性系统模型转化为线性方程 ,求得了目标任意机动时的非线性末制导系统的加速度指令。以纵向平面为例进行了仿真计算 ,结果表明该方法是行之有效的 ,得到的解可以用来改进导弹大离轴发射角时的进攻能力。  相似文献   

15.
基于神经网络的鲁棒制导律设计   总被引:4,自引:0,他引:4  
周锐  张鹏 《航空学报》2002,23(3):262-264
 基于神经网络理论对寻的导弹鲁棒制导律进行了优化设计。建立了制导系统非线性运动学方程和鲁棒性能函数,并将鲁棒性能函数转化成了微分对策的极小极大化问题。采用伴随 BP技术,将微分对策的两点边值求解问题转化为 2个神经网络的学习问题,训练后的 2个神经网络分别作为对策双方的最优控制器在线使用,避免了直接求解复杂的鲁棒制导律问题,仿真结果表明了该方法有效性。  相似文献   

16.
基于多智能体强化学习的空间机械臂轨迹规划   总被引:1,自引:0,他引:1  
赵毓  管公顺  郭继峰  于晓强  颜鹏 《航空学报》2021,42(1):524151-524151
针对某型六自由度(DOF)空间漂浮机械臂对运动目标捕捉场景,开展了基于深度强化学习的在线轨迹规划方法研究。首先给出了机械臂DH (Denavit-Hartenberg)模型,考虑组合体力学耦合特性建立了多刚体运动学和动力学模型。然后提出了一种改进深度确定性策略梯度算法,以各关节为决策智能体建立了多智能体自学习系统。而后建立了"线下集中学习,线上分布执行"的空间机械臂对匀速直线运动目标捕捉训练系统,构建以目标相对距离和总操作时间为参数的奖励函数。最后通过数学仿真验证,实现了机械臂对各向匀速运动目标的快速捕捉,平均完成耗时5.4 s。与传统基于随机采样的规划算法对比,本文提出的自主决策运动规划方法求解速度和鲁棒性更优。  相似文献   

17.
提出了一种基于矩特征和特征光流的运动目标跟踪方法.首先进行角点特征提取,按照提出的基于矩特征的局部范围内匹配角点的策略,完成了序列图像的角点匹配;然后,按照本文提出的光流聚类准则完成了两个图像目标的聚类.仿真实验表明,本文算法在减少计算量的同时可提高跟踪精度,且可克服目标做小角度旋转时的失跟问题.  相似文献   

18.
介绍了某军用飞机飞行中“意外侧滑”现象的基本情况及影响,全面分析了可能原因;然后从“飞参”数据人手分析了具体原因,提出了有关建议。分析表明,由于该机的“副翼一方向舵”交联方案比较简单,特别是该方案仅用于消除因压杆量变化导致的侧滑,不仅不能消除压杆量变化前已存在的侧滑,反而在客观上起到保持原侧滑角的航向稳定作用,所以某军用飞机的“副翼一方向舵”交联模块实际上并不能完全消除侧滑。其速度500~750km/h内较明显“意外侧滑”由杆位不正或修正性压杆与“副翼一方向舵”交联模块及飞机本身航向稳定性共同导致。鉴于“意外侧滑”存在诸多不利影响,应在某军用飞机单座型和双座型前舱增加侧滑角显示。  相似文献   

19.
为更好的对军用探测车运动过程进行控制,提出了轮履复合式探测车运动学模型的构建方法.通过对轮履复合式移动系统结构进行分析,首先建立了探测车三维运动学模型,并推出了其运动方程;其次建立了探测车车体速度与车轮速度之间的雅可比矩阵,利用最小二乘法对车体速度进行求解,提供了获得探测车越障过程中位置和方位的方法.最后对探测车行进过程进行了运动仿真,数值仿真分析验证了运动学模型的正确性及轮履复合式移动系统的运动特性.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号