首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
行人重识别是计算机视觉领域的一个重要部分,但是容易受到行人图片实际采集环境的影响,导致行人特征表达不充分,进一步导致模型精度不高。提出一种基于注意力机制和条件卷积改进的行人重识别方法,使行人特征得到更充分的表达。将注意力机制引入特征提取网络ResNet50中,对输入图像空间和通道上的关键信息进行加权强化,同时抑制可能的噪声;将条件卷积模块引入主干网络,动态调整卷积核参数,使模型能够在保持高效推理的同时提高容量和性能;利用Market1501、MSMT17和DukeMTMC-ReID主流数据集对改进方法进行评估,Rank1分别提升1.1%、2.4%、1.3%,mAP分别提升0.5%、2.3%、1.3%,结果表明:改进方法能够使行人特征得到更好的表达,识别精度得到提升。  相似文献   

2.
行人再识别是图像检索领域的一个重要部分,但是由于行人姿态各异、背景复杂等因素,导致提取到的行人特征鲁棒性和代表性不强,进而影响行人再识别的精度。在AlignedReID++算法基础上,提出了基于空间注意力机制的行人特征提取方法,应用在行人再识别中取得了很好的效果。首先,在特征提取部分,引入空间注意力机制来增强特征表达,同时抑制可能的噪声;其次,通过在卷积层中引入实例正则化层(IN)来辅助批正则化层(BN)对特征进行归一化处理,解决单一BN层对特征色调变化以及光照变化的不敏感性,提高特征提取对亮度、色调变化的鲁棒性;最后,在Market1501、DukeMTMC和CUHK03 3个行人再识别通用数据集上对所提改进模型进行测试评价。实验结果显示:改进后的模型在3个数据集上识别精度分别提升了2%、2.9%和5.1%,表明改进后的模型相较于改进前的模型,在精度以及鲁棒性上都有显著提高。   相似文献   

3.
针对行人特征表达不充分的问题,提出了一种基于通道注意力机制的行人重识别方法。将通道注意力机制SE模块嵌入到骨干网络ResNet50中,对关键特征信息进行加权强化;采用动态激活函数,根据输入特征动态调整ReLU的参数,增强网络模型的非线性表达能力;将梯度中心化算法引入Adam优化器,提升网络模型的训练速度和泛化能力。在Market1501、DukeMTMC-ReID和CUHK03主流数据集上对改进后的模型进行测试评价,Rank-1分别提升2.17%、2.38%和3.50%,mAP分别提升3.07%、3.39%和4.14%。结果表明:改进后的模型能够提取更强鲁棒性的行人表达特征,达到更高的识别精度。   相似文献   

4.
基于迁移学习的卷积神经网络SAR图像目标识别   总被引:2,自引:0,他引:2  
针对卷积神经网络中因网络参数随机初始化和参数过多导致的收敛速度慢及过拟合的问题,提出了一种基于迁移学习监督式预训练的卷积神经网络。首先,引入迁移学习的思想,采用小规模数据集作为源域的训练样本,针对源域中源任务进行监督式训练得到预训练模型;然后,构建一个多层的卷积神经网络作为目标域中目标任务的待训练网络,将源域中获得的预训练模型作为该网络的初始参数,大规模数据作为目标域的训练样本进行网络的微调,通过这种基于特征选择的迁移学习,实现源域到目标域的特征信息迁移;针对卷积神经网络中全连接层参数过多的问题,采用卷积层替代全连接层。试验使用美国国防高等研究计划署的移动与静止目标搜索识别(Moving and Stationary Target Acquisition and Recognition,MSTAR)数据集中三类目标数据作为源域样本,十类目标数据作为目标域样本,结果表明该算法的十类目标识别精度达到了99.13%,且具有更快的误差收敛速度。  相似文献   

5.
针对大面积图像修复缺失严重时,需要完整且高质量训练样本的问题,提出了一种将残缺或含噪图像样本作为训练集的双生成器深度卷积生成对抗网络(DGDCGAN)模型。构建两个生成器和一个鉴别器以解决单一生成器收敛慢的问题,用残缺图像样本作为训练集,通过交叉计算、搜索损失区域类似的图像信息作为训练生成模型的样本,收敛速度更快。鉴别器损失函数改进为输出的Wasserstein距离,使用自适应估计算法优化生成器损失函数和鉴别器损失函数的模型参数,最小化两两图像之间的总距离差,使用鉴别模型和修复图像总距离变化均方差最小化两个指标优化修复结果。在4个公开数据集上进行主客观实验,结果表明:所提方法能使用残缺图像样本作为训练集,有效实现大面积失真图像的修复,且收敛速度和修复效果优于现有图像修复方法。   相似文献   

6.
针对无人机航拍图像尺度变化大、识别难度大和目标普遍较小的问题,提出一种基于改进单阶段多框检测器(single shot multibox detector, SSD)的无人机航拍目标检测算法——RCBnet.该算法为了提升网络的特征提取能力,将SSD算法的特征提取网络修改为Resnet-50并采用特征融合的方式,将特征图进行融合,用融合后的特征图构建特征金字塔;为了增强算法对物体的检测能力,设计一种联合注意力机制的多尺度卷积结构来有效调节感受野,实现不同尺寸卷积核对特征图的并行运算;针对训练过程中正负样本极具不平衡的问题,该算法采用Focal Loss损失函数训练网络模型,使其侧重于困难样本.通过与其他经典算法相比可知,所提算法在无人机航拍图像中具有更高的检测精度、更好的检测性能和鲁棒性,相比SSD,精度提高达3.46%.  相似文献   

7.
为了提高遥感图像超分辨率重建的质量,提出了一种基于流的遥感图像重建算法。首先,在Glow模型的基础上引入改进后的RRDB架构用于低分辨率图像特征提取,通过构建更多层和连接以提升训练的稳定性。然后,以一种纯数据驱动的流模型来训练分布的参数,通过最大化负的对数似然的方法进行优化,得到该算法的损失函数。实验证明该模型在网络训练过程中能够快速达到稳定收敛的状态,且具有很强的泛化能力。用重建出的图像质量对比SRCNN、SRGAN、ESRGAN,经过测试后发现,提出的算法远远优于SRCNN算法,与其他算法相比也有明显优势。重建出的图像不仅在指标上有所提升,例如与SRCNN相比,PSRN和SSIM分别提升了15%和40%,且人眼观察时有更高的清晰度,高频细节更为丰富。  相似文献   

8.
为解决航空发动机部件表面缺陷检测精度低、检测速度慢的问题,提出一种改进的YOLOv4算法进行智能检测。在路径聚合网络(PANet)结构中融合浅层特征与深层特征,增大特征检测尺度,同时去除自下而上的路径增强结构,提高小目标检测精度和整体检测速度;根据各类缺陷数量不同的情况,优化聚焦损失中的平衡参数,增加权重因子调节各类缺陷的损失权重,将改进后的聚焦损失代替分类误差中的交叉熵损失函数,降低样本不平衡和难易样本对检测精度的影响。实验表明:相比于原始YOLOv4算法,改进后的YOLOv4算法在测试集上的平均精度均值(mAP)为90.10%,提高了2.17%;检测速度为24.82 fps,提高了1.58 fps,检测精度也高于单发多框检测(SSD)算法、EfficientDet算法、YOLOv3算法和YOLOv4-Tiny算法。  相似文献   

9.
在航空航天领域中,惯性陀螺等精密器件装配精度要求较高,目前大多采用人工装配的方法,装配效率低、装配过程受人主观影响大。针对上述存在的问题,采用基于Faster R-CNN模型的目标识别算法,通过VGG16特征提取网络提取特征信息,在模型训练过程中利用COCO数据集的深度网络模型进行迁移训练,防止模型过拟合并加速参数的训练过程。同时,该方法还与其他深度学习模型以及传统的目标识别算法进行了对比,在自建的数据模型测试集上进行试验。结果表明,基于VGG16的Faster R-CNN目标识别模型在复杂环境及物体发生遮挡的情况下对于惯性陀螺的识别具有明显的优势,准确率可达到87.80%,召回率80.30%,识别速度可达到15FPS,能够满足实时性要求。  相似文献   

10.
无人机数据链通信受到各种自然与人为的干扰,信噪比(SNR)是信道状态和通信质量的有效评估指标。为解决传统估计算法信噪比估计精度不足的问题,提出了一种卷积神经网络(CNN)与长短时记忆(LSTM)网络结合的估计模型。利用仿真与实测相结合的方式,构建了一个包含不同信噪比、调制方式、衰落信道等信息的无人机通信信号数据集;在网络训练阶段,将样本序列进行分割,对分割后的每一部分序列使用CNN-LSTM网络提取深度特征,多次训练并保存模型参数;在测试阶段,利用构建好的测试集完成对算法的验证与测试,得到信噪比估计值。实验表明,相比于传统信噪比估计算法与单一网络结构的深度学习算法,所提算法的均方误差最低,实现了对信噪比的高精度估计。   相似文献   

11.
针对面部表情识别中,传统机器学习方法特征提取较为复杂,浅层卷积神经网络识别率不高,以及深度卷积神经网络易带来梯度爆炸或弥散的问题,构建了残差网络嵌入注意力机制的多尺度深度可分离表情识别网络。通过多层多尺度深度可分离残差单元的叠加进行不同尺度的表情特征提取,使用CBAM注意力机制进行表情特征的筛选,提升有效表情特征权重的表达,削弱训练数据的噪声影响。所提网络模型在Fer-2103和CK+表情数据集分别取得了73.89%和97.47%的准确度,表明所提网络具有较强的泛化性。   相似文献   

12.
自动调制识别是空间认知通信系统的关键技术,有助于实现自适应信号解调。深度神经网络虽然具有特征提取能力强的优势,但也存在参数众多、计算量大的问题,难以实现空间在轨应用。针对以上问题,提出了一种轻量化、高性能的卷积神经网络结构。网络先提取信号的同相正交相关特征,再提取时域特征,最后提取各通道特征均值进行分类。对11种调制方式分类的实验结果表明:当信噪比高于0 dB时,平均识别准确率能达到86.94%,较传统的高阶累积量的方法提高了31.54%;与目前高识别准确率的深度神经网络模型相比,仅使用不到10%的模型参数,在树莓派4B上计算速度平均提高了20倍。   相似文献   

13.
当前,市场上普遍使用的负责推理的终端人工智能(AI)芯片使用训练好的参数对数据进行快速高效运算。但在通常训练过程中使用的数据集和真实数据的分布不一致,由此获得的参数会导致终端AI芯片识别准确度降低。为此,提出了一种基于终端AI芯片的可视化反馈系统架构方法。使用反卷积特征可视化方法,在具有高效计算性能的终端AI芯片上,对卷积核参数进行迭代优化,达到可识别该图像目的。相比于CPU/GPU和FPGA,所提架构在卷积神经网络模型里,更具有高效处理能力和灵活可塑性。实验表明,该研究有效提高了终端AI芯片的普适性、识别准确度和处理效率。   相似文献   

14.
光伏组件的遮挡物识别是光伏运维系统中不可或缺的环节,传统识别算法多依赖人工巡检,成本高昂且效率低下。基于卷积神经网络,提出了一种面向光伏组件的遮挡物识别算法PORNet。通过引入特征金字塔,构建多个分辨率下具有丰富语义信息的图像特征,提升对遮挡物尺度和密度的敏感性。通过特征自选择,筛选出语义最具代表性的特征图,以加强物体环境的语义信息表达。用筛选出的特征图完成遮挡物识别,从而提升识别准确率。在自建光伏组件落叶遮挡数据集上进行了实验比较和分析,并对识别性能进行了评估,通过与现有物体识别算法相比,所提算法的准确率和召回率分别提升了9.21%和15.79%。   相似文献   

15.
现有图像配准算法中,借助图像采集设备参数的方法存在硬件内参难以获得或精度不够的问题,采用匹配图像特征计算图像单应性的方法存在对场景深度信息利用不全的问题。针对这一现象,提出了结合可见光图像与其深度信息来生成更具有真实性的配准图像对数据,用以训练得到一个可以进行像素级别图像配准的深度神经网络PIR-Net。建立了一个大规模、多视角、超仿真的图像配准数据集:多视角配准(MVR)数据集,该数据集包含7 240对含有深度信息的待配准图像及其像素级别的坐标对准真值;基于编码器-解码器的深度神经网络结构,训练得到一个能以全分辨率形式对2幅输入图像之间的坐标变化矩阵进行重建的PIR-Net。通过实验验证了PIR-Net能够在未知相机内参的情况下实现不同视角的可见光图像配准,并比传统算法具有更高的配准精度。在MVR数据集上,PIR-Net的配准误差仅为通用的特征匹配对准算法(SIFT+RANSAC)的18%,同时减少了30%的时间消耗。   相似文献   

16.
为了以低成本、高时空分辨率进行大雾天气监测,提出一种利用无线通信链路进行基于深度学习的大雾天气监测方法。由于信道中不同浓度的大雾天气在信号中留有的特征不同,采集了4种不同浓度大雾下的无线电信号,建立无线电大雾天气监测数据集;通过在传统ResNet50网络中引入注意力机制并进行特征融合,得到改进后的A-ResNet50模型。利用A-ResNet50网络提取接收信号中留有的不同浓度大雾天气的特征,对四类不同浓度大雾天气进行分类识别,达到监测大雾天气的目的。所提方法在建立的数据集上进行了验证,相较于其他传统分类算法,本方法性能最优,最终识别准确率达到86.18 %,结果证明了该方法的可行性和有效性。  相似文献   

17.
关键词抽取对文本处理影响较大,其识别的准确度及流畅程度是任务的关键。为有效缓解短文本关键词提取过程中词划分不准确、关键词与文本主题不匹配、多语言混合等难题,提出了一种基于图到序列学习模型的自适应短文本关键词生成模型ADGCN。模型采用图神经网络与注意力机制相结合的方式作为对文本信息特征提取的编码框架,针对词的位置特征和语境特征编码,解决了短文本结构不规律和词之间存在关联复杂信息的问题。同时采用了一种线性解码方案,生成了可解释的关键词。在解决问题的过程中,从某社交平台收集并公布了一个标签数据集,其包括社交平台发文文本和话题标签。实验中,从用户需求角度出发对模型结果的相关性、信息量、连贯性进行评估和分析,所提模型不仅可以生成符合短文本主题的关键词,还可以有效缓解数据扰动对模型的影响。所提模型在公开数据集KP20k上仍表现良好,具有较好的可移植性   相似文献   

18.
基于FPGA的红外目标识别神经网络加速器设计   总被引:1,自引:0,他引:1       下载免费PDF全文
在红外目标识别领域,基于卷积神经网络的深度学习算法的识别精度已远远超过了传统模式识别算法,但神经网络的实现需要庞大的计算和存储,难以在无人机等嵌入式平台上进行部署。针对此问题,将通道级量化策略和梯度的近似优化训练引入到了低比特神经网络模型的建立中,并提出了一种可充分利用硬件计算资源的FPGA加速器,其整体平均性能为65.6GOPS。与其他相关工作的对比表明,低比特量化方法及其FPGA加速器实现,可以为嵌入式红外目标识别系统提供一种能效高、识别精度高的解决方案。  相似文献   

19.
根据车辆重识别中区域置信度不同,提出了基于高置信局部特征的车辆重识别优化算法。首先,利用车辆关键点检测获得对应的多个关键点坐标信息,分割出车标扩散区域和其他重要的局部区域。根据车标扩散区域的高区分度特性,提升局部区域的置信度。使用多层卷积神经网络对输入图片进行处理,根据局部区域分割信息,对卷积得到的特征张量进行空间维度上的切割,获得代表全局信息和关键局部信息的特征张量。然后,通过全连接层特征张量转化为表示车辆个体的一维向量,计算损失函数。最后,在测试阶段使用全局特征,并利用训练好的车标扩散区域提取分支获得高置信局部特征,缩短局部识别一致的车辆目标距离。在典型车辆重识别数据集VehicleID上进行测试,验证了所提算法的有效性。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号