排序方式: 共有142条查询结果,搜索用时 312 毫秒
82.
83.
随着无人机(UAV)遥感技术的发展,无人机航拍图像目标检测逐渐成为无人机应用领域的一项核心技术,在交通规划、军事侦查及环境监测等领域具有重要应用价值。针对无人机图像中小目标实例多、背景复杂及特征提取困难的问题,提出一种基于多尺度分割注意力的无人机航拍图像目标检测算法MSA-YOLO。首先,利用嵌入在骨干网络瓶颈层的多尺度分割注意力单元建立多尺度特征间的远程依赖关系,从而强化关键特征的表达能力并抑制背景噪声干扰;其次,设计了一种自适应加权特征融合方法,该方法动态的优化各输出特征层权重,实现浅层特征与深层特征的深度融合;最后,在VisDrone公开数据集上的实验结果表明:该方法取得了34.7%的平均均值精度(mAP),相比于基线算法YOLOv5提高了2.8%,在复杂背景下仍能显著提升无人机图像目标检测性能。 相似文献
84.
针对无人机(UAV)跟踪过程中目标经常出现尺寸小、尺度变化大和相似物干扰等问题,提出了一种基于双注意力混洗的多尺度无人机实时跟踪算法。考虑到无人机视角下目标像素点少,构建了双采样融合的深层网络,既提供了语义信息丰富的深度特征,又保留了目标的细节信息;设计了双注意力混洗模块,通道注意力和空间注意力同时分组筛选提取到的特征信息,混洗不同通道间的信息,加强信息交流,提高了算法辨别能力;为利用不同层的特征信息,加入多个区域建议网络完成目标的分类和回归,并针对无人机的目标特点,将结果进行加权融合。实验结果表明:所提算法在数据集上的成功率和准确率分别为60.3%和79.3%,速度为37.5帧/s。所提算法的辨别能力和多尺度适应能力明显增强,能有效应对无人机跟踪中常见的挑战。 相似文献
85.
86.
以航迹预测方法作为切入点,重庆-广州航路航空器记录的ADS-B数据作为研究内容,提出了一种融合注意力机制的长时序航迹预测方法(CNN-LSTM-attention)。研究运用一维卷积神经网络对航迹数据多维特征进行提取,并将经纬度、高度、速度、航向等的多维特征向量构造成时序形式作为LSTM网络输入,通过赋予LSTM网络隐含层的权重占比并区别不同时序点隐藏层信息对未来航迹预测的影响程度来达到优化预测模型的作用。构建好的CNN-LSTM-attention模型采用Adam优化算法进行训练,LSTM和CNN-LSTM作为实验对比模型,将决定系数R2作为模型评价标准来衡量航迹预测模型的准确性。实验结果表明加入注意力机制的神经网络预测模型CNN+LSTM+attention(卷积神经网络-长短期记忆网络-注意力机制)的方法相较于其他两种,其预测精确性更高。 相似文献
87.
找出目标的位置和类别是目标检测的主要任务。随着人工智能和深度学习的发展,目标检测可以达到人眼所达不到的精度。由于信息较少,覆盖面积小且基于锚框的检测算法易受锚框大小、比例数目的影响,对较小的目标难以精确检测。针对以上问题,改进无锚框算法全卷积单阶段目标检测(Fully Convolutional One-stage Object Detection,FCOS)实现了小目标检测的效率和精度。将FCOS算法的特征提取网络结构残差网络(Residual Network,ResNet)更换为轻量级网络结构MobileNetV3,随后在骨干网络中引入通道注意力机制和空间注意力机制对特征提取网络进行改进,最后设计T交并比(TIOU)代替原本的交并比(IOU),改善模型精度。实验结果表明,所改进的网络结构与FCOS相比,网络训练时间和模型大小为原来的一半,计算参数量由原来的32.12×106减少为11.73×106,减少到原来的三分之一,模型推理速度提升了10%,每秒传输帧数为11帧,与主流网络FasterRCNN相比,检测精度和速度更快,可以满足对小目标... 相似文献
88.
黄丽冰 《桂林航天工业学院学报》2023,(1):51-60
深度学习模型作为机器学习的分支之一,被广泛应用于以医学影像分析为代表的图像识别领域。其优势在于不依赖人为标注,模型训练过程中计算机能够识别和处理人为遗漏的特征信息,从而达到甚至超过人类处理的准确性。基于深度模型中未知的数据处理过程所带来的可解释性普遍缺失的问题,现有解决方式主要包括建立内在解释性、注意力机制解释特定模型以及以LIME为代表的不可知模型解释等。对可解释性进行量化评估的方式仍在探索,特别是在医学决策相关模型中针对医生和患者双方的解释性评估中已经提出了一些可供参考的量表。当下对深度学习模型在医学影像中的应用研究普遍更关注准确性而非可解释性,导致可解释性缺乏,进而阻碍深度学习模型的临床实际应用。如何平衡准确性和可解释性以开发令医患双方能够信服的深度学习模型将成为业界未来的研究重点。 相似文献
89.
红外弱小目标的检测识别是军事侦察和遥感探测领域的一项关键技术。针对现有的传统目标检测方法普遍存在的检测误报率高、环境适应性差等问题,本文设计提出了一种基于Swin Transformer和多尺度特征融合的红外弱小目标检测方法。该方法首先在基于编解码Unet网络架构的基础上,通过引入Swin Transformer的自注意力机制代替常规的卷积核来进行目标特征的分层提取,从而有助于在更大的感受野下挖掘目标在不同尺度下的潜在信息;之后,通过设计一个自底向上的跨层特征融合模块作为网络模型的解码器,可以从复杂背景中保留红外弱小目标特征,并将目标的浅层局部信息和深层语义信息进行充分融合。试验测试结果表明,所提方法在红外小目标公共测试数据集SIRST上能够实现0.747的交并比指标(IoU),以及0.752的归一化交并比指标(nIoU),其性能均优于其它典型方法,在不同复杂场景下均拥有更好的检测效果。 相似文献
90.
针对行人特征表达不充分的问题,提出了一种基于通道注意力机制的行人重识别方法。将通道注意力机制SE模块嵌入到骨干网络ResNet50中,对关键特征信息进行加权强化;采用动态激活函数,根据输入特征动态调整ReLU的参数,增强网络模型的非线性表达能力;将梯度中心化算法引入Adam优化器,提升网络模型的训练速度和泛化能力。在Market1501、DukeMTMC-ReID和CUHK03主流数据集上对改进后的模型进行测试评价,Rank-1分别提升2.17%、2.38%和3.50%,mAP分别提升3.07%、3.39%和4.14%。结果表明:改进后的模型能够提取更强鲁棒性的行人表达特征,达到更高的识别精度。 相似文献