首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对面部表情识别中,传统机器学习方法特征提取较为复杂,浅层卷积神经网络识别率不高,以及深度卷积神经网络易带来梯度爆炸或弥散的问题,构建了残差网络嵌入注意力机制的多尺度深度可分离表情识别网络。通过多层多尺度深度可分离残差单元的叠加进行不同尺度的表情特征提取,使用CBAM注意力机制进行表情特征的筛选,提升有效表情特征权重的表达,削弱训练数据的噪声影响。所提网络模型在Fer-2103和CK+表情数据集分别取得了73.89%和97.47%的准确度,表明所提网络具有较强的泛化性。   相似文献   

2.
为了降低患者的辐射风险,低剂量CT(LDCT)广泛用于临床诊断,但辐射剂量的减少在重建的LDCT图像中引入了斑点噪声和条纹伪影。为了提高LDCT图像的质量,提出了一种基于可变阶变分模型的后处理技术。所提出的变分模型使用边缘指示器控制变分阶数,根据图像的特征在一阶全变分(TV)正则项和二阶有界Hessian(BH)正则项之间交替变换。采用基于快速傅里叶变换(FFT)的分裂Bregman算法求解所提出的变分模型。该模型在保留高剂量CT(HDCT)图像相应结构的同时,有效抑制了斑点噪声和条纹伪影。重建的图像和实验数据表明,所提出的变分模型比现有的先进模型具有更好的质量。   相似文献   

3.
针对现有深度学习图像修复算法修复壁画时,存在特征提取不足及细节重构丢失等问题,提出了一种多尺度特征和注意力融合的生成对抗壁画修复深度学习模型。设计多尺度特征金字塔网络提取壁画中不同尺度的特征信息,增强特征关联性;采用自注意力机制及特征融合模块构建多尺度特征生成器,以获取丰富的上下文信息,提升网络的修复能力;引入最小化对抗损失与均方误差促进判别器的残差反馈,从而结合不同尺度的特征信息完成壁画修复。通过对真实敦煌壁画数字化修复的实验结果表明,所提算法能够有效保护壁画图像的边缘和纹理等重要特征信息,并且主观视觉效果及客观评价指标均优于比较算法。  相似文献   

4.
基于深度学习的目标检测算法通常需要使用非极大值抑制等后处理方法对预测框进行筛选,无法在行人拥挤的场景下平衡模型的检测精度和召回率。虽然迭代检测的方法可以解决非极大值抑制等方法带来的问题,但是重复检测同样会限制模型的性能。提出了一种历史信息特征敏感的行人迭代检测方法。引入带权重的历史信息特征(WHIC),提高特征的区分度;利用历史信息特征提取模块(HIFEM)得到不同尺度的历史信息特征,并融合进主网络中进行多尺度检测,增强了模型对历史信息特征的敏感度,有效抑制重复检测框的产生。实验结果表明:所提方法在拥挤场景的行人检测数据集CrowdHuman和WiderPerson上取得了最优的检测精度和召回率。  相似文献   

5.
基于深度学习的图像超分辨率(SR)重建方法主要通过增加模型的深度来提升图像重建的质量,但同时增加了模型的计算代价,很多网络利用注意力机制来提高特征提取能力,但难以充分学习到不同区域的特征。为此,提出一种基于期望最大化(EM)自注意力残差的图像超分辨率重建网络。该网络通过改进基础残差块,构建特征增强残差块,以更好地复用残差块中所提取的特征。为增加特征信息在空间上的相关性,引入EM自注意力机制,构建EM自注意力残差模块来增强模型中每个模块的特征提取能力,并通过级联EM自注意力残差模块来构建整个模型的特征提取结构。所获得的特征图通过上采样的图像重建模块获得重建的高分辨率图像。将所提方法与主流方法进行实验对比,结果表明:所提方法在5个流行的SR测试集上能够取得较好的主观视觉效果和更优的性能指标。  相似文献   

6.
随着社交网络的快速发展,带有用户提供标签的社交网络图像呈现爆炸式增长。但是用户提供的标签是不准确的,存在很多不相关以及错误的标签。这势必会增加相关多媒体任务的困难。针对标签噪声无序性以及常用的高斯分布对标签噪声中大噪声过于敏感的问题,但是高斯分布对大噪声比较敏感。鉴于此,采用对各种噪声都具有鲁棒性的柯西分布拟合噪声,提出了一个基于噪声柯西分布的弱监督非负低秩深度学习(CDNL)模型,通过柯西分布建模标签噪声来获得理想标签,并利用深度神经网络模块学习视觉特征和理想标签之间的内在联系,来得到图像对应的正确标签,从而大幅提高社交网络图像的标签准确率。所提模型不仅可以修正错误标签、补充缺失标签,也可以对新图像进行标注。在2个公开的社交网络图像数据集上进行了验证,并且与一些最新的相关工作进行了对比,证实了所提模型的有效性。   相似文献   

7.
高分辨率遥感图像分割在军事、民用等领域具有良好的应用前景,但由于复杂的背景条件以及干扰物的遮挡,导致现有算法无法较好地从遥感影像中提取道路细节信息。研究基于改进U Net网络模型,提出了MDAU-Net(multi dimension attention U-Net)网络结构模型,通过对U-Net网络结构加深至七层结构来提升精细分割道路的能力;并提出了一种多维注意力模块MD-MECA(multi dimension modified efficient channel attention),将其添加至编码部分的特征传递步骤中,以达到对编码部分的特征传递进行优化的目的;其中利用DropBlock与Batch Normalization解决网络训练过程中出现的过拟合。试验结果表明:改进后算法可以有效提升道路的提取效果,在测试集上的准确率达到了97.04%。  相似文献   

8.
基于改进NL-means算法的显微CT图像降噪   总被引:1,自引:0,他引:1  
显微CT(Computed Tomography)采用微焦点射线源,射线剂量低,CT图像噪声大,对其降噪十分必要.综述了现存主要CT图像降噪算法及其优缺点,介绍了NL(nonlocal)-means算法,根据实验结果分析了其会在图像平滑区域引入人工伪影的不足.根据NL-means算法的不足,在原算法中引入图像的梯度信息,提出了改进的降噪算法,改进算法保持了原算法优良的降噪功能,并能有效抑制人工伪影,且能够提高图像细节对比度,实验结果验证了改进算法的有效性.  相似文献   

9.
针对基于深度学习的语义分割模型在解析遥感图像时,小尺寸目标和目标边界存在分割不准确的问题,提出一种U型网络模型SGE-Unet。该模型通过优化网络结构加强模型的特征提取能力;融合空间组增强注意力,提升模型对上下文语义信息的解析能力;采用中值频率平衡交叉熵损失函数抑制类别分布不均衡的影响。在2个数据集上进行实验,SGE-Unet的整体准确率、平均交并比、■分数和Kappa系数均高于主流模型,Vaihingen数据集中小尺寸目标车的交并比和F1分数分别为0.719和0.901,比次优模型提升了16%和11%,实验结果表明所提模型能更精准地分割小尺寸目标及目标边界。  相似文献   

10.
针对行人特征表达不充分的问题,提出了一种基于通道注意力机制的行人重识别方法。将通道注意力机制SE模块嵌入到骨干网络ResNet50中,对关键特征信息进行加权强化;采用动态激活函数,根据输入特征动态调整ReLU的参数,增强网络模型的非线性表达能力;将梯度中心化算法引入Adam优化器,提升网络模型的训练速度和泛化能力。在Market1501、DukeMTMC-ReID和CUHK03主流数据集上对改进后的模型进行测试评价,Rank-1分别提升2.17%、2.38%和3.50%,mAP分别提升3.07%、3.39%和4.14%。结果表明:改进后的模型能够提取更强鲁棒性的行人表达特征,达到更高的识别精度。   相似文献   

11.
针对无人机航拍图像尺度变化大、识别难度大和目标普遍较小的问题,提出一种基于改进单阶段多框检测器(single shot multibox detector, SSD)的无人机航拍目标检测算法——RCBnet.该算法为了提升网络的特征提取能力,将SSD算法的特征提取网络修改为Resnet-50并采用特征融合的方式,将特征图进行融合,用融合后的特征图构建特征金字塔;为了增强算法对物体的检测能力,设计一种联合注意力机制的多尺度卷积结构来有效调节感受野,实现不同尺寸卷积核对特征图的并行运算;针对训练过程中正负样本极具不平衡的问题,该算法采用Focal Loss损失函数训练网络模型,使其侧重于困难样本.通过与其他经典算法相比可知,所提算法在无人机航拍图像中具有更高的检测精度、更好的检测性能和鲁棒性,相比SSD,精度提高达3.46%.  相似文献   

12.
针对现有安全帽检测算法难以检测小目标、密集目标等缺点,提出一种基于YOLOv5s的安全帽检测改进算法。采用DenseBlock模块来代替主干网络中的切片结构,提升网络的特征提取能力;在网络颈部检测层加入SE-Net通道注意力模块,引导模型更加关注小目标信息的通道特征,以提升对小目标的检测性能;对数据增强方式进行改进,丰富小尺度样本数据集;增加一个检测层以便能更好地学习密集目标的多级特征,从而提高模型应对复杂密集场景的能力。此外,构建一个面向密集目标及远距离小目标的安全帽检测数据集。实验结果表明:所提改进算法比原始YOLOv5s算法平均精确率(mAP@0.5)提升6.57%,比最新的YOLOX-L及PP-YOLOv2算法平均精确率分别提升1.05%与1.21%,在密集场景及小目标场景下具有较强的泛化能力。  相似文献   

13.
U-Net在医学影像分割领域是目前应用最广泛的分割模型,其“编码-解码”结构也成为了构建医学影像分割模型最常用的结构。尽管U-Net在许多领域实现了非常高的分割准确度,但是存在着计算复杂度高、推理速度慢、运行消耗内存大等问题,导致其难以在移动应用平台部署。为解决这一问题,提出了一种结合多层特征及空间信息蒸馏的医学影像分割方法TinyUnet。该方法使用轻量化的U-Net作为学生网络。考虑到小模型没有足够的学习能力,通过选择合适的蒸馏位置,对多层教师特征图进行蒸馏; 同时加强教师网络深层特征图的边缘,并构建边缘关键点图结构,采用图卷积网络对学生网络进行空间信息蒸馏,从而补充重要的边缘信息和空间信息。实验表明:在3个医学影像数据集上,TinyUnet能够达到U-Net 98.3%~99.7%的分割准确度,但是将U-Net的参数量平均降低了99.6%,运算速度提高了约110倍; 同时,与其他轻量化医学影像分割模型相比,TinyUnet不仅具有较高的分割准确度,而且占用内存更少,运行速度更快。   相似文献   

14.
行人重识别是计算机视觉领域的一个重要部分,但是容易受到行人图片实际采集环境的影响,导致行人特征表达不充分,进一步导致模型精度不高。提出一种基于注意力机制和条件卷积改进的行人重识别方法,使行人特征得到更充分的表达。将注意力机制引入特征提取网络ResNet50中,对输入图像空间和通道上的关键信息进行加权强化,同时抑制可能的噪声;将条件卷积模块引入主干网络,动态调整卷积核参数,使模型能够在保持高效推理的同时提高容量和性能;利用Market1501、MSMT17和DukeMTMC-ReID主流数据集对改进方法进行评估,Rank1分别提升1.1%、2.4%、1.3%,mAP分别提升0.5%、2.3%、1.3%,结果表明:改进方法能够使行人特征得到更好的表达,识别精度得到提升。  相似文献   

15.
知识图谱(KG)补全旨在通过知识库中已知三元组来预测缺失的链接。由于大多数方法都是独立地处理三元组,而忽略了知识图谱所具有的异质结构和相邻节点中固有的丰富的信息,导致不能充分挖掘三元组的特征。考虑基于端到端的知识图谱补全任务,提出了一种图对比注意力网络(GCAT),通过注意力机制同时捕获局部邻域内实体和关系的特征,并封装实体邻域上下文信息。为了有效封装三元组特征,引入一个子图级别的对比训练对象用于增强生成的实体嵌入的质量。为了验证GCAT的有效性,在链接预测任务上评估了所提方法,实验结果表明,在数据集FB15k-237中,MRR比InteractE提高0.005,比A2N模型提高0.042;在数据集WN18RR中,MRR比InteractE提高0.019,比A2N模型提高0.032。实验证明提出的GCAT模型能够有效预测知识图谱中缺失的链接。  相似文献   

16.
行人再识别是图像检索领域的一个重要部分,但是由于行人姿态各异、背景复杂等因素,导致提取到的行人特征鲁棒性和代表性不强,进而影响行人再识别的精度。在AlignedReID++算法基础上,提出了基于空间注意力机制的行人特征提取方法,应用在行人再识别中取得了很好的效果。首先,在特征提取部分,引入空间注意力机制来增强特征表达,同时抑制可能的噪声;其次,通过在卷积层中引入实例正则化层(IN)来辅助批正则化层(BN)对特征进行归一化处理,解决单一BN层对特征色调变化以及光照变化的不敏感性,提高特征提取对亮度、色调变化的鲁棒性;最后,在Market1501、DukeMTMC和CUHK03 3个行人再识别通用数据集上对所提改进模型进行测试评价。实验结果显示:改进后的模型在3个数据集上识别精度分别提升了2%、2.9%和5.1%,表明改进后的模型相较于改进前的模型,在精度以及鲁棒性上都有显著提高。   相似文献   

17.
关键词抽取对文本处理影响较大,其识别的准确度及流畅程度是任务的关键。为有效缓解短文本关键词提取过程中词划分不准确、关键词与文本主题不匹配、多语言混合等难题,提出了一种基于图到序列学习模型的自适应短文本关键词生成模型ADGCN。模型采用图神经网络与注意力机制相结合的方式作为对文本信息特征提取的编码框架,针对词的位置特征和语境特征编码,解决了短文本结构不规律和词之间存在关联复杂信息的问题。同时采用了一种线性解码方案,生成了可解释的关键词。在解决问题的过程中,从某社交平台收集并公布了一个标签数据集,其包括社交平台发文文本和话题标签。实验中,从用户需求角度出发对模型结果的相关性、信息量、连贯性进行评估和分析,所提模型不仅可以生成符合短文本主题的关键词,还可以有效缓解数据扰动对模型的影响。所提模型在公开数据集KP20k上仍表现良好,具有较好的可移植性   相似文献   

18.
海洋锋作为海洋中两种不同性质的水体之间的边界,对渔业和海洋环境保护等许多领域有重要影响,如何快速准确实现海洋锋的自动检测和识别对于海洋监测和预报具有重要的科学意义。将深度学习图像分割网络与提取锋面特征的方法相结合,利用基于U-Net架构的实例分割模型,分别建立海洋锋区和锋面中心线的智能检测模型,同时在编解码过程中采用残差学习单元对模型特征提取网络进行改进。研究结果表明,锋面智能检测模型能够准确提取先前锋面检测算法所识别的锋区和锋面中心线特征,Dice系数分别达到了0.92和0.97,达到了很好的检测效果。同时,利用不同锋面阈值得到的样本数据对模型进行训练,比较结果表明,降低样本集阈值之后模型精度有了显著的提升。  相似文献   

19.
基于抗噪声ICA的高光谱数据特征提取方法   总被引:3,自引:0,他引:3  
特征提取是高光谱数据应用的一个重要环节,用于将高光谱数据中具有特殊性质的地物分离出来并去除冗余信息.提出了一种使用独立成分分析(ICA,Independent Component Analysis)进行高光谱遥感地物特征提取的方法.为了解决ICA对噪声过分敏感的问题,采用最大噪声分量(MNF,Maximum Noise Fraction)算法替代传统的主成分分析对数据作降噪处理,由MNF引出的不完全独立成分分析(UICA,Undercomplete ICA)在不牺牲特征提取能力的情况下能够获得很高的运算效率.给出了HYDICE和PHI的数据试验结果,分别测试了算法在时间效率和特征提取能力方面的性能,证明了该算法具有预期的性能.  相似文献   

20.
为降低弹道目标整体误识别代价,提出了基于代价敏感剪枝(CSP)一维卷积神经网络(1D-CNN)的弹道目标高分辨距离像识别方法。首先,基于彩票假设提出了同时以降低模型复杂度和误识别代价为目标的统一框架;然后,在此基础上,提出了基于人工蜂群算法的网络结构无梯度优化方法,以网络结构搜索的方式自动地寻找1D-CNN的代价敏感子网络,即代价敏感剪枝;最后,为了使代价敏感子网络在微调过程中仍以最小化误识别代价为目标,提出了一种代价敏感交叉熵(CSCE)损失函数对训练进行优化,使代价敏感子网络侧重对误识别代价较高的类别正确分类来进一步降低整体误识别代价。实验结果表明:结合CSP和CSCE损失函数的1D-CNN能在保持较高的识别正确率的前提下,相比传统的1D-CNN具有更低的整体误识别代价,且降低了50%以上的计算复杂度。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号