首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为了解决训练过程中卷积模型参数较多、收敛速度较慢的问题,提出了一种基于MobileFaceNet网络改进的人脸识别方法。首先,使用MobileFaceNet网络提取人脸特征,在提取特征的过程中,通过引入可分离卷积减少模型中卷积层参数的数量;其次,通过在MobileFaceNet网络中引入风格注意力机制来增强特征的表达,同时使用AdaCos人脸损失函数来训练模型,利用AdaCos损失函数中的自适应缩放系数,来动态地调整超参数,避免了人为设置超参数对模型的影响;最后,分别在LFW、AgeDB和CFP-FF测试数据集上对训练模型进行评估。实验结果显示:改进后的模型在LFW、AgeDB和CFP-FF测试数据集上的识别精度分别提升了0.25%、0.16%和0.3%,表明改进后的模型相较于改进前的模型在精度和鲁棒性上有所提高。   相似文献   

2.
针对跨域行人重识别中遮挡造成特征匹配缺失及细粒度辨识性特征被忽略的问题,提出了基于渐进式注意力和分块遮挡的跨域行人重识别方法。该方法通过学习行人未遮挡区域的多粒度辨别性特征,实现空间不对齐下的特征匹配。渐进式注意力模块将特征逐步分割为多个局部块,依次学习每块的辨别性特征,由粗到细地感知前景信息,从而解决目前网络不能提取多层次辨识性特征的问题,增强了特征的匹配能力;渐进式分块遮挡模块很好地适应模型逐步变强的学习能力特性,通过由易到难地生成遮挡数据,有效提取了未遮挡区域的辨识性特征,进而解决模型错误识别遮挡样本的问题,使得所提模型在遮挡情况下的鲁棒性得到有效提高。实验结果表明:所提方法在首位命中率和平均精确度2个指标上与当前主流方法相比具有显著的优越性;与2020年CVPR会议中QAConv行人重识别方法相比,在DukeMTMC-reID数据集(MSMT17→DukeMTMCreID)上的2个指标分别高出2.3%和6.2%,能够更加有效地实现跨域行人重识别,在OccludedDuke数据集(DukeMTMC-reID→Occluded-Duke)上的2个指标分别达到49.5%和39.0%,...  相似文献   

3.
在航空航天领域中,惯性陀螺等精密器件装配精度要求较高,目前大多采用人工装配的方法,装配效率低、装配过程受人主观影响大。针对上述存在的问题,采用基于Faster R-CNN模型的目标识别算法,通过VGG16特征提取网络提取特征信息,在模型训练过程中利用COCO数据集的深度网络模型进行迁移训练,防止模型过拟合并加速参数的训练过程。同时,该方法还与其他深度学习模型以及传统的目标识别算法进行了对比,在自建的数据模型测试集上进行试验。结果表明,基于VGG16的Faster R-CNN目标识别模型在复杂环境及物体发生遮挡的情况下对于惯性陀螺的识别具有明显的优势,准确率可达到87.80%,召回率80.30%,识别速度可达到15FPS,能够满足实时性要求。  相似文献   

4.
高分辨率遥感图像分割在军事、民用等领域具有良好的应用前景,但由于复杂的背景条件以及干扰物的遮挡,导致现有算法无法较好地从遥感影像中提取道路细节信息。研究基于改进U Net网络模型,提出了MDAU-Net(multi dimension attention U-Net)网络结构模型,通过对U-Net网络结构加深至七层结构来提升精细分割道路的能力;并提出了一种多维注意力模块MD-MECA(multi dimension modified efficient channel attention),将其添加至编码部分的特征传递步骤中,以达到对编码部分的特征传递进行优化的目的;其中利用DropBlock与Batch Normalization解决网络训练过程中出现的过拟合。试验结果表明:改进后算法可以有效提升道路的提取效果,在测试集上的准确率达到了97.04%。  相似文献   

5.
一种阈值自适应调整的实时音频分割方法   总被引:1,自引:0,他引:1  
基于内容的音频分析近年来引起了较多学者的关注.对自动分割方法进行了分析,分割是对音频信号进行深入分析的首要步骤,通常根据能量、幅值、基音等时域或频域的声音特征,设定若干固定阈值来实现.由于实时音频信号来源复杂,环境和采集设备的变化都会导致阈值的波动,从而直接影响到分割的质量.提出了一种基于声音背景学习的阈值初值计算方法,主要针对实时音频应用,设计了环境因子作为对外界环境进行检测的度量,并利用其自适应调节分割阈值,采用查表法,通过状态转移进行分片类型判断以在效率和精度之间取得平衡,并设计了多组分割实验对上述方法分别进行了验证.  相似文献   

6.
针对自然条件下人脸表情识别面临遮挡、光照、姿势变化等挑战,存在识别准确率低的问题, 提出了一种新的深度学习网络模型用于人脸表情识别。以ResNet为基础网络,融合了瓶颈注意力机制及全局二阶池化层,其中瓶颈注意力机制专注于表情重要特征的提取,全局二阶池化层度量表情特征之间的相关性,在此基础上通过联合正则化策略,平衡和改善特征数据分布情况,提高表情识别准确率。所提方法在2个公开数据集FER2013和CK+ 进行了测试及验证,最高准确率分别达到了74.227%和95.8%,性能优于诸多现存的主流方法,表明所提模型具有较好的准确性和鲁棒性。   相似文献   

7.
跨域是行人重识别的重要应用场景,但是源域与目标域行人图像在光照条件、拍摄视角、成像背景与风格等方面的表观特征差异性是导致行人重识别模型泛化能力下降的关键因素。针对该问题,提出了基于多标签协同学习的跨域行人重识别方法。利用语义解析模型构造了基于语义对齐的多标签数据表示,以引导构建更关注行人前景区域的局部特征,达到语义对齐的目的,减少背景对跨域重识别的影响。基于行人图像全局特征和语义对齐后的行人局部特征,利用协同学习平均模型生成行人重识别模型的多标签表示,减少跨域场景下噪声硬标签的干扰。利用协同学习网络框架联合多标签的语义对齐模型,提高行人重识别模型的识别能力。实验结果表明:在Market-1501→ DukeMTMC-reID、DukeMTMC-reID→Market-1501、Market-1501→MSMT17、DukeMTMC-reID→MSMT17跨域行人重识别数据集上,与NRMT方法相比,平均精度均值分别提高了8.3%、8.9%、7.6%、7.9%,多标签协同学习方法具有显著的优越性。   相似文献   

8.
利用数字高程模型自动检测火星表面陨石坑   总被引:1,自引:1,他引:0       下载免费PDF全文
为了克服利用影像识别陨石坑的诸多限制因素,利用"火星全球勘探者"(MGS)火星激光高度计(MOLA)得到的火星三维DEM数据,转换获得地形曲率,然后利用设定阈值将曲率图转换为二值图像,结合图像分割floodin算法可以得到待检测陨石坑,最后利用Hough变换可以检测出陨石坑。其成功率达到73.4%,可以有效地从DEM中识别陨石坑。利用DEM识别陨石坑的方法可以识别更多新的陨石坑,为现存的陨石坑目录提供新的数据信息。  相似文献   

9.
利用人工智能和深度学习技术自动化地分析互联网海量图片,快速、准确地识别有害的暴恐图像并及时处置是反恐工作的重要手段之一。研究了利用深度学习和迁移学习技术对暴恐图像进行分类识别。首先,定义了暴恐图像的主要概念特征,并针对性地构建数据集;其次,针对暴恐图像正样本较少的问题,设计深度神经网络模型和迁移学习方式;最后,基于构建的训练数据集进行模型训练和测试。结果显示:所提方法可以快速、准确地对互联网图片进行分类识别,平均分类准确率达到96.7%,从而有效降低人工检测的劳动强度,为反恐预警工作提供决策支持。   相似文献   

10.
复杂动态场景下目标检测与分割算法   总被引:1,自引:1,他引:0  
在动态场景等复杂条件下,往往难以对序列图像目标进行准确的检测与分割。根据序列图像中目标在复杂条件下的成像特点,提出了一种基于融合尺度不变特征变换(SIFT)流特征显著模型的动态场景目标检测与分割算法。通过对SIFT流算法表示运动特征信息的优势进行分析,并结合图像国际照明协会(CIE)Lab颜色空间的颜色和亮度特征信息,建立四维特征向量空间。利用改进的多尺度中心-环绕对比方法生成各特征通道的显著图并进行线性融合,建立序列图像的动态场景目标显著模型。最后利用均值漂移聚类算法和形态学处理实现对检测目标的精确分割。实验结果表明,相比传统检测与分割算法,该算法在动态背景与航拍等复杂场景下能够分割出更为完整的目标区域,具有良好的鲁棒性和高分割精度。   相似文献   

11.
针对行人特征表达不充分的问题,提出了一种基于通道注意力机制的行人重识别方法。将通道注意力机制SE模块嵌入到骨干网络ResNet50中,对关键特征信息进行加权强化;采用动态激活函数,根据输入特征动态调整ReLU的参数,增强网络模型的非线性表达能力;将梯度中心化算法引入Adam优化器,提升网络模型的训练速度和泛化能力。在Market1501、DukeMTMC-ReID和CUHK03主流数据集上对改进后的模型进行测试评价,Rank-1分别提升2.17%、2.38%和3.50%,mAP分别提升3.07%、3.39%和4.14%。结果表明:改进后的模型能够提取更强鲁棒性的行人表达特征,达到更高的识别精度。   相似文献   

12.
分析了空间非合作目标影像测量及特征点提取机理,根据对接中特征点识别噪声不确定和空间摄动引起的模型误差,对传统滤波方法进行改进;通过量测更新后的新息数据对量测噪声量级进行估计,同时采用渐消自适应方法对模型误差进行处理,增进滤波效果;设计了针对空间非合作目标对接段的滤波器,能够提供对接段相对位置、速度、姿态角及角速率估计信息。仿真结果表明,提出的改进滤波算法能够在测量噪声不确定和模型误差条件下达到较好效果。  相似文献   

13.
针对输电线路金具缺陷样本不足和缺陷目标形态多样化,仅仅利用深度学习模型导致金具缺陷分类准确率较低的问题,提出了一种结合深度网络和逻辑回归模型的因果分类方法。首先,通过样本扩充方法获得数量丰富化和角度多样化的数据集;然后,基于微调后的VGG16模型提取深度特征并进行特征处理,以构建符合因果关系学习的输入特征集;最后,通过全局混杂平衡进行金具缺陷特征与标签之间的因果关系学习,构建符合金具特点的因果逻辑回归模型,完成金具缺陷分类。为了证明所提方法的有效性,利用无人机实际采集的4类金具缺陷图片分别进行了实验,所使用的训练样本和测试样本数量较原始数据集提升了5倍左右。实验结果表明:所提方法可以实现对输电线路金具缺陷的精准分类,其中,防震锤相交和变形分类准确率分别达到了0.929 9和0.911 8,屏蔽环锈蚀和均压环损坏分类准确率分别达到了0.956 7和0.966 9。   相似文献   

14.
针对中医舌诊中舌体分割不准确、分割速度较慢且需要人工标定候选区域等问题,提出了一种端到端的舌图像分割算法。与传统舌图像分割算法相比,所提算法可以得到更为准确的分割结果,并且不需要人工操作。首先,使用孔卷积算法,可以在不增加参数的条件下扩大网络的特征图谱。其次,使用孔卷积空间金字塔池化(ASPP)模块,令网络通过不同的感受野学习舌图像的多尺度特征。最后,将深度卷积神经网络(DCNN)和全连接的条件随机场(CRF)相结合,细化分割后的舌体边缘。实验结果表明:所提算法优于传统舌图像分割算法和主流的深度卷积神经网络,具有较高的分割精度,平均交并比达到了95.41%。   相似文献   

15.
语言引导的目标分割旨在将文本描述的目标与其所指代的实体进行匹配,从而实现对文本、实体之间关系的理解与指代目标的定位。该任务在信息抽取、文本分类、机器翻译等应用场景中具有重要的应用价值。基于Refvos模型提出一种语言引导的多粒度特征融合目标分割方法,能够对特定目标精准定位。利用Swin Transformer和Bert网络,分别提取多粒度的视觉特征和文本特征,提高对整体与细节的表征能力;将文本特征分别与不同粒度视觉特征进行融合,通过语言引导增强特定目标表达;通过卷积长短期记忆网络对多粒度融合特征进行优化,在不同粒度特征间进行信息交流,得到更精细化的分割结果。在UNC、UNC+、G-Ref、ReferIt数据集上进行训练并测试所提方法。实验结果表明:相比Refvos,所提方法在UNC数据集的val、testB子集中IoU结果分别提升0.92%、4.1%,在UNC+数据集的val、testA、testB子集中IoU结果分别提升1.83%、0.63%、1.75%。所提方法在G-Ref、ReferIt数据集的IoU结果分别为40.16%和64.37%,达到前沿水平,证明所提方法的有效性与先进性...  相似文献   

16.
为了更加准确地进行异源遥感图像的变化检测任务,提出了一种基于混合网络的异源遥感图像变化检测算法。利用伪孪生网络提取异源遥感图像块间空间维度的变化特征,利用早期融合网络提取异源遥感图像块间光谱维度的变化特征,将2支网络提取的特征进行融合,并将融合后的变化特征输入到sigmoid层进行二分类检测。同时,在伪孪生网络中加入对比损失函数,通过优化对比损失函数,使得在特征空间中,未变化图像对的空间特征差异更小,变化图像对的空间特征差异更大,以提升网络的区分能力和收敛速度。   相似文献   

17.
多目标识别跟踪的关键问题是特征提取和目标匹配.为了提取生产线上堆积棒材的特征,提出粘连目标分割和多目标识别的方法.采用中值滤波和形态学滤波去除噪声,自适应阈值化和分水岭变换分割粘连目标;然后采用区域统计、参数识别、噪声区域去除以及聚类分析等手段进行目标特征识别,提取出棒材的质心点坐标作为特征;对棒材图像序列提出采用模板匹配、相近位移匹配和Kalman滤波的方法建立跟踪链,通过插入、删除、更新链节点进行目标跟踪;对于图像处理中可能出现的漏检目标和虚增目标,进行了计数结果校正.在现场采集了100帧连续图像后,采用此方法跟踪计数的精度为96.2%.   相似文献   

18.
针对发动机转子早期裂纹难以检测的特点,建立发动机转子早期裂纹扩展模型,提出了对裂纹振动信号进行小波分析和信息融合的方法对转子早期裂纹进行检测。最后,以转子系统为对象进行实验研究,结果表明,此方法能够有效地提取转子早期裂纹故障特征并能对故障进行准确识别。  相似文献   

19.
针对复杂脑网络分析中网络结构变化阈值选择中没有公认的标准确定合适阈值这一问题,基于拓扑分析中的持续同调性理论,本文提出一种多尺度大脑网络建模分析方法,该方法在大脑全尺度距离范围之内,通过不断增加阈值,运用Rips过滤算法捕获网络的动态持续拓扑特征,并用条形码和持续图对拓扑特征可视化,最后通过计算持续图之间的Bottleneck距离和Wasserstein距离分析持续特征的稳定性。实验结果表明,该方法能更准确地提取大脑网络的拓扑结构特征并提高诊断分类的准确性。  相似文献   

20.
为了以低成本、高时空分辨率进行大雾天气监测,提出一种利用无线通信链路进行基于深度学习的大雾天气监测方法。由于信道中不同浓度的大雾天气在信号中留有的特征不同,采集了4种不同浓度大雾下的无线电信号,建立无线电大雾天气监测数据集;通过在传统ResNet50网络中引入注意力机制并进行特征融合,得到改进后的A-ResNet50模型。利用A-ResNet50网络提取接收信号中留有的不同浓度大雾天气的特征,对四类不同浓度大雾天气进行分类识别,达到监测大雾天气的目的。所提方法在建立的数据集上进行了验证,相较于其他传统分类算法,本方法性能最优,最终识别准确率达到86.18 %,结果证明了该方法的可行性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号