首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 93 毫秒
1.
针对面部表情识别中,传统机器学习方法特征提取较为复杂,浅层卷积神经网络识别率不高,以及深度卷积神经网络易带来梯度爆炸或弥散的问题,构建了残差网络嵌入注意力机制的多尺度深度可分离表情识别网络。通过多层多尺度深度可分离残差单元的叠加进行不同尺度的表情特征提取,使用CBAM注意力机制进行表情特征的筛选,提升有效表情特征权重的表达,削弱训练数据的噪声影响。所提网络模型在Fer-2103和CK+表情数据集分别取得了73.89%和97.47%的准确度,表明所提网络具有较强的泛化性。   相似文献   

2.
无人机已被广泛应用于军事和民用领域,目标跟踪技术是无人机应用的关键技术之一。针对无人机视频跟踪过程中目标易发生尺度变化、遮挡等问题,提出一种基于残差学习的自适应无人机目标跟踪算法。首先,结合残差学习和空洞卷积的优点构建深度网络提取目标特征,同时克服网络退化问题;其次,将提取的目标特征信息输入核相关滤波算法,构建定位滤波器确定目标的中心位置;最后,根据目标外观特性的不同进行自适应分块,并计算出目标尺度的伸缩系数。仿真实验结果表明:所提算法能够有效应对尺度变化、遮挡等情况对跟踪性能的影响,在跟踪成功率和精确度上均高于其他对比算法。   相似文献   

3.
针对现有深度学习图像修复算法修复壁画时,存在特征提取不足及细节重构丢失等问题,提出了一种多尺度特征和注意力融合的生成对抗壁画修复深度学习模型。设计多尺度特征金字塔网络提取壁画中不同尺度的特征信息,增强特征关联性;采用自注意力机制及特征融合模块构建多尺度特征生成器,以获取丰富的上下文信息,提升网络的修复能力;引入最小化对抗损失与均方误差促进判别器的残差反馈,从而结合不同尺度的特征信息完成壁画修复。通过对真实敦煌壁画数字化修复的实验结果表明,所提算法能够有效保护壁画图像的边缘和纹理等重要特征信息,并且主观视觉效果及客观评价指标均优于比较算法。  相似文献   

4.
针对无人机对风机叶片表面缺陷检测中出现的多尺度目标问题,本文提出一种基于改进SSD的风机叶片缺陷检测方法。以具有多尺度结构框架的目标检测模型SSD为基础,引入残差网络ResNet50作为其特征提取网络,用以获取更深层次的细节特征信息,从而提升缺陷检测模型的整体效果。在建立的风机叶片表面缺陷图像数据集下进行模型验证,结果表明,该方法的平均精确度mAP@.5为84.29%,与YOLOv3和RetainNet相比,对各类型缺陷的平均精确度分别提高了2.92%和8.69%,同时较传统SSD算法平均精确度提升了2.21%。  相似文献   

5.
针对红外图像的特点,提出了一种YOLOv5-IF算法,使用了基于残差机制的特征提取网络,实现了不同特征层之间信息的高效交互,能够得到更丰富的目标语义信息。通过改进YOLOv5的检测方案,增加更大尺度的检测头,有效提升了红外图像中小目标的检测概率。针对计算平台资源有限、算法实时性等问题,设计了Detection Block模块,并由此构建了特征整合网络,该模块不仅能提升算法检测精度,还有效缩减了模型参数量。在FLIR红外自动驾驶数据集上,本文算法的平均准确率(mAP)为74%,参数量仅19.5MB,优于现有的算法。  相似文献   

6.
针对无人机航拍图像背景复杂、小尺寸目标较多等问题,提出了一种基于倒置残差注意力的无人机航拍图像小目标检测算法。在主干网络部分嵌入倒置残差模块与倒置残差注意力模块,利用低维向高维的特征信息映射,获得丰富的小目标空间信息和深层语义信息,提升小目标的检测精度;在特征融合部分设计多尺度特征融合模块,融合浅层空间信息和深层语义信息,并生成4个不同感受野的检测头,提升模型对小尺寸目标的识别能力,减少小目标的漏检;设计马赛克混合数据增强方法,建立数据之间的线性关系,增加图像背景复杂度,提升算法的鲁棒性。在VisDrone数据集上的实验结果表明:所提模型的平均精度均值比DSHNet模型提升了1.2%,有效改善了无人机航拍图像小目标漏检、误检的问题。  相似文献   

7.
近年来,基于深度学习的视频压缩技术主要基于卷积神经网络(CNN)且采用运动补偿-残差编码的架构,由于常见的CNN只能利用局部的相关性,以及预测残差本身的稀疏特性,难以取得最优压缩性能。因此,提出一种基于Transformer架构的条件视频压缩算法,以实现更优的压缩效果。所提算法基于前后帧之间的运动信息,利用可形变卷积得到对应的预测帧特征;将预测帧特征作为条件信息,对原始输入帧特征进行条件编码,避免了直接编码稀疏的残差信号;利用特征间的非局部相关性,提出一个基于Transformer的深度条件视频压缩编码算法,用来实现运动信息编码和条件编码,进一步提升压缩编码的性能。实验结果表明:所提算法在HEVC、UVG数据集上均超越了当前主流的基于深度学习的视频压缩算法。  相似文献   

8.
为实现公安监控系统内容分析的精准智能及提高服务实战能力,提出一种轻量化的多目标实时检测算法。首先,基于CenterNet检测网络增加了CBNet的多融合阶梯级联结构,有效地解决了主干网络在日常监控中特征提取能力不足的问题;其次,通过模型剪枝压缩网络减少参数量,加快了监控视频分析速度。本文利用部分COCO数据集和自行采集的现场数据进行训练与测试,并与其他主流检测算法(YOLO、Faster-RCNN、SSD等)进行消融实验。实验结果表明:所提模型在公共安全监控中能有效地做到速度与精度的均衡,并具有较强的普适性。   相似文献   

9.
行人的空间尺度差异是影响行人检测性能的主要瓶颈之一。针对这一问题,提出了跨尺度特征聚合网络(TS-FAN)有效检测多尺度行人。首先,鉴于不同尺度空间呈现出的特征差异性,引入一种基于多路径区域建议网络(RPN)的尺度补偿策略,其在多尺度卷积特征层上自适应地生成一系列与其感受野大小相对应的候选目标尺度集。其次,考虑到不同层次卷积特征在视觉语义上的互补性,提出了跨尺度特征聚合网络模块,其通过横向连接、自上而下路径和由底向上路径,有效地聚合具有语义鲁棒性的高层特征和具有精确定位信息的低层特征,实现对卷积层特征的增强表示。最后,联合多路径RPN尺度补偿策略和跨尺度特征聚合网络模块,构建了一种尺度自适应感知的多尺度行人检测网络。实验结果表明,所提方法与当前一流的行人检测方法TLL-TFA相比,在整个Caltech公开测试数据集上(All:行人高度大于20像素)的行人漏检率降低到26.21%(提高了11.94%),尤其对于Caltech小尺寸行人子数据集上(Far:行人高度在20~30像素之间)的行人漏检率降低到47.30%(提高了12.79%),同时在尺度变化剧烈的ETH数据集上的效果也取得显著提升。   相似文献   

10.
针对图像多分类任务,提出基于深度卷积的残差三生网络,旨在通过残差学习和距离比较来训练神经网络得到有效的特征表示。首先,设计了一个21层的深度卷积神经网络作为三生网络的嵌入网络,其中该卷积网络共连接6个块(block)。利用残差学习的方式,每个block的输出层由卷积层的输出和该block的输入共同组成,降低网络学习难度,避免网络出现退化问题。然后,每个block中采用相同拓扑结构分路的卷积层,拓宽网络的宽度。最后,在全连接层拼接了来自前面卷积层和block的输出,加强特征信息的传递。训练前,针对正负样本采用交叉组合的采样方法来增加有效训练样本量;训练期间,用样本中心点更换原点样本作为输入,能平均降低0.5%错误率。在与其他三生网络的对比实验中,在MNIST、CIFAR10和SVHN数据库上达到最好的效果,在所有分类网络中,本文网络在MNIST上达到最好的效果,在CIFAR10和SVHN上表现优异。   相似文献   

11.
反舰导弹对舰船要害部位的精确打击能力是精确制导武器的关键技术之一。针对反舰导弹导引头对舰船要害部位检测精度低、特征提取能力不足,预测框的处理降低检测速度等问题,提出了一种多尺度特征融合的Anchor-Free轻量化舰船要害部位检测算法。由于舰船要害部位检测数据具有多尺度、多角度特性,引入多尺度特征融合模块,综合利用不同感受野的检测信息,优化特征提取;利用高效轻量化注意力机制改进Hourglass结构中的跨层连接,提升检测精度,降低算法总参数量;使用迁移学习有效提升算法收敛效果。在建立的舰船要害部位检测数据集和公开的PASCAL VOC数据集进行实验,检测准确率分别提升了4.41%和5.57%,分析算法参数与运算量,设计了模块消融实验,论证了所提算法的有效性。   相似文献   

12.
红外图像背景抑制可以为红外目标检测识别任务提供支撑。在实际的应用场景中,红外图像中的目标多为弱小目标,其特征不明显,一般背景抑制算法难以将其从背景中分离,而达不到背景抑制的最佳效果。针对上述问题,提出使用Pos-FCN网络实现红外图像背景抑制的方法,该方法使用特征卷积结构,依靠高分辨网络结构获取弱小目标的特征信息,通过大尺寸卷积特征图的前向传播方式实现了高维度特征中弱小目标信息的保留,使用卷积降采样特征提取和上采样图像恢复方式实现了端到端的处理,并在前置训练阶段引入了位置信息强化网络骨干特征提取效果。结果表明,该方法处理后的红外图像中信杂比提高至3.877,对比度提高至0.297,检测率达到了93.6%,因此,该方法可以实现良好的背景抑制效果。  相似文献   

13.
3D目标检测是计算机视觉和自动驾驶中一项重要的场景理解任务。当前基于立体图像的3D目标检测方法大多没有充分考虑多个目标之间的尺度存在较大差异,从而尺度小的物体容易被忽略,导致检测精度低。针对这一问题,提出了一种基于立体图像的多路径特征金字塔网络(MpFPN)3D目标检测方法。MpFPN对特征金字塔网络进行了扩展,增加了自底向上的路径、由上至下的路径及输入特征图到输出特征图之间的连接,为联合区域提议网络提供了更高语义信息和更细粒度空间信息的多尺度特征信息。实验结果表明:在3D目标检测KITTI数据集上,无论在场景简单、中等、复杂情况下,所提方法获得的结果都优于比较方法的结果。   相似文献   

14.
基于多尺度梯度及深度神经网络的汉字识别   总被引:1,自引:0,他引:1  
介绍了一种基于多尺度滑动窗的方法提取文字的梯度直方图特征,并结合深度神经网络对印刷体汉字进行识别.针对梯度直方图的空间关系,使用可伸缩的滑动窗对图像进行分割,在不同尺度上获取文字的特征信息,有效融合汉字的全局特征和局部分块特征.实验采用5层的深度神经网络模型对国标一级3755个印刷体汉字进行分类,并应用Dropout技术防止训练过拟合,提高神经网络的泛化能力.实验准确率达到98.292%,有较好的识别性能,验证了本文多尺度梯度特征及深度神经网络模型在文字识别上的有效性.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号