首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
通过对跨模态检索问题的研究,属性信息的使用可以增强所提取特征的语义表达性,但现有基于自然语言的跨模态行人重识别算法对行人图片和文本的属性信息利用不够充分。基于双重属性信息的跨模态行人重识别算法充分考虑了行人图片和文本描述的属性信息,构建了基于文本属性和图片属性的双重属性空间,并通过构建基于隐空间和属性空间的跨模态行人重识别端到端网络,提高了所提取图文特征的可区分性和语义表达性。跨模态行人重识别数据集CUHK-PEDES上的实验评估表明,所提算法的检索准确率Top-1达到了56.42%,与CMAAM算法的Top-1(56.68%)具有可比性,Top-5、Top-10相比CMAAM算法分别提升了0.45%、0.29%。针对待检索图片库中可能存在身份标签的应用场景,利用行人的类别信息提取属性特征,可以较大幅度提高跨模态行人图片的检索准确率,Top-1达到64.88%。消融实验证明了所提算法使用的文本属性和图片属性的重要性及基于双重属性空间的有效性。   相似文献   

2.
针对无人机航拍图像背景复杂、小尺寸目标较多等问题,提出了一种基于倒置残差注意力的无人机航拍图像小目标检测算法。在主干网络部分嵌入倒置残差模块与倒置残差注意力模块,利用低维向高维的特征信息映射,获得丰富的小目标空间信息和深层语义信息,提升小目标的检测精度;在特征融合部分设计多尺度特征融合模块,融合浅层空间信息和深层语义信息,并生成4个不同感受野的检测头,提升模型对小尺寸目标的识别能力,减少小目标的漏检;设计马赛克混合数据增强方法,建立数据之间的线性关系,增加图像背景复杂度,提升算法的鲁棒性。在VisDrone数据集上的实验结果表明:所提模型的平均精度均值比DSHNet模型提升了1.2%,有效改善了无人机航拍图像小目标漏检、误检的问题。  相似文献   

3.
在室外监控视频的场景下,由于场景的复杂性及目标的多样性,监控视频中的目标存在难以检测的情况,如目标被遮挡、目标尺寸变化等,目标检测任务仍然存在挑战。基于此,提出了一种利用运动信息引导基于卷积神经网络的目标检测算法来提高目标检测的准确率。对运动目标检测算法进行一定的改进,使得到的运动前景图中能够保持静止目标前景的存在;利用运动前景图中的前景可以指示目标空间位置的特点,在特征层面将网络提取的特征图与获取的以运动前景图为主的运动信息相融合,提高特征图可能存在目标区域的响应值;在目标检测算法的检测器中,引入一个定位分支,利用视频帧的运动前景图,学习候选目标的定位置信度,并与目标的分类置信度加权求和,作为目标最终的置信度,再通过非极大值抑制方法得到检测结果。实验证明,在固定摄像机下采集的数据集中,所提算法能够提升目标检测的准确率。   相似文献   

4.
根据车辆重识别中区域置信度不同,提出了基于高置信局部特征的车辆重识别优化算法。首先,利用车辆关键点检测获得对应的多个关键点坐标信息,分割出车标扩散区域和其他重要的局部区域。根据车标扩散区域的高区分度特性,提升局部区域的置信度。使用多层卷积神经网络对输入图片进行处理,根据局部区域分割信息,对卷积得到的特征张量进行空间维度上的切割,获得代表全局信息和关键局部信息的特征张量。然后,通过全连接层特征张量转化为表示车辆个体的一维向量,计算损失函数。最后,在测试阶段使用全局特征,并利用训练好的车标扩散区域提取分支获得高置信局部特征,缩短局部识别一致的车辆目标距离。在典型车辆重识别数据集VehicleID上进行测试,验证了所提算法的有效性。   相似文献   

5.
热斑现象是造成光伏组件发电能力下降的重要原因之一,热斑检测是光伏电站运维必不可少的工作。然而分布式光伏电站的规模普遍较小、选址分散、环境复杂多样,使用传统的热斑检测算法需要投入大量的人力资源。基于此,提出了一种基于注意力机制的热斑检测算法HSNet。通过图像分割消除反光影响,结合通道注意力机制,学习通道间的特征信息,增强目标区域的重要性,采用自定义锚点的方法提高检测速度,使用焦点损失激活函数和基于物体先验概率的类别预测方式改善训练目标样本不均衡导致的分类准确性低的问题,通过回归方法获取准确的目标位置。实验表明:设计的目标检测算法在窗体回归精度和分类准确性方面均有明显的优势,边界框平均精度和准确率分别提升了3.18%和2.42%。   相似文献   

6.
在航空航天领域中,惯性陀螺等精密器件装配精度要求较高,目前大多采用人工装配的方法,装配效率低、装配过程受人主观影响大。针对上述存在的问题,采用基于Faster R-CNN模型的目标识别算法,通过VGG16特征提取网络提取特征信息,在模型训练过程中利用COCO数据集的深度网络模型进行迁移训练,防止模型过拟合并加速参数的训练过程。同时,该方法还与其他深度学习模型以及传统的目标识别算法进行了对比,在自建的数据模型测试集上进行试验。结果表明,基于VGG16的Faster R-CNN目标识别模型在复杂环境及物体发生遮挡的情况下对于惯性陀螺的识别具有明显的优势,准确率可达到87.80%,召回率80.30%,识别速度可达到15FPS,能够满足实时性要求。  相似文献   

7.
基于改进型YOLO算法的遥感图像舰船检测   总被引:1,自引:1,他引:0  
目标检测算法在PASCAL VOC等数据集中取得了非常好的检测效果,但是在大尺度遥感图像中舰船目标的检测准确率却很低。因此,针对可见光遥感图像的特点,在YOLOv3-Tiny算法的基础上增加了特征映射模块,为预测层提供丰富的语义信息,同时在特征提取网络中引用残差网络,提高了检测准确率,从而有效提取舰船特征。实验结果表明:优化后的M-YOLO算法检测准确率为94.12%。相比于SSD和YOLOv3算法,M-YOLO算法的检测准确率分别提高了11.11%和9.44%。   相似文献   

8.
针对行人重识别中存在遮挡及行人判别特征层次单调的问题,在IBN-Net50-a网络的基础上,提出了一种结合随机遮挡和多粒度特征融合的网络模型。通过对输入图像进行随机遮挡处理,模拟行人被遮挡的真实情景,以增强应对遮挡的鲁棒性;将网络分为全局分支、局部粗粒度互融分支和局部细粒度互融分支,提取全局显著性特征,同时补充局部多粒度深层特征,丰富行人判别特征的层次性;进一步挖掘局部多粒度特征间的相关性进行深度融合;联合标签平滑交叉熵损失和三元组损失训练网络。在3个标准公共数据集和1个遮挡数据集上,将所提方法与先进的行人重识别方法进行比较,实验结果表明:在Market1501、DukeMTMC-reID、CUHK03标准公共数据集上,所提方法的Rank-1分别达到了95.2%、89.2%、80.1%,在遮挡数据集Occluded-Duke上,所提方法的Rank-1和mAP分别达到了60.6%和51.6%,均优于对比方法,证实了方法的有效性。  相似文献   

9.
高分辨率遥感图像分割在军事、民用等领域具有良好的应用前景,但由于复杂的背景条件以及干扰物的遮挡,导致现有算法无法较好地从遥感影像中提取道路细节信息。研究基于改进U Net网络模型,提出了MDAU-Net(multi dimension attention U-Net)网络结构模型,通过对U-Net网络结构加深至七层结构来提升精细分割道路的能力;并提出了一种多维注意力模块MD-MECA(multi dimension modified efficient channel attention),将其添加至编码部分的特征传递步骤中,以达到对编码部分的特征传递进行优化的目的;其中利用DropBlock与Batch Normalization解决网络训练过程中出现的过拟合。试验结果表明:改进后算法可以有效提升道路的提取效果,在测试集上的准确率达到了97.04%。  相似文献   

10.
针对无人机(UAV)跟踪过程中目标经常出现尺寸小、尺度变化大和相似物干扰等问题,提出了一种基于双注意力混洗的多尺度无人机实时跟踪算法。考虑到无人机视角下目标像素点少,构建了双采样融合的深层网络,既提供了语义信息丰富的深度特征,又保留了目标的细节信息;设计了双注意力混洗模块,通道注意力和空间注意力同时分组筛选提取到的特征信息,混洗不同通道间的信息,加强信息交流,提高了算法辨别能力;为利用不同层的特征信息,加入多个区域建议网络完成目标的分类和回归,并针对无人机的目标特点,将结果进行加权融合。实验结果表明:所提算法在数据集上的成功率和准确率分别为60.3%和79.3%,速度为37.5帧/s。所提算法的辨别能力和多尺度适应能力明显增强,能有效应对无人机跟踪中常见的挑战。  相似文献   

11.
    
属性是图像的语义描述,可以表示图像中某些内容的存在与否,它可以是物体的形状、材质、部件、类别以及功能,也可以是场景的类别以及上下文信息等.由于目标类别与所在背景存在相关关系,提出基于背景属性和目标属性相融合的前景目标识别方法,即对每种背景属性和目标属性分别训练支持向量机(SVM)分类器,并将属性在对应分类器上的得分进行串联组成新的特征,并训练得到最终分类器.对a-Pascal数据库中每幅图像,人工标注了10种背景属性,结合已有的目标属性,进行目标识别实验.与传统方法、基于目标属性的分类方法以及其他前景、背景相结合算法的对比实验结果表明,所提算法比其他算法提高大约2%,背景属性有助于提高目标识别率.  相似文献   

12.
二维形状识别是物体识别中的一个基本问题,被广泛地应用于商标检索、指纹识别、物体定位、图像检索等多个领域。其中,基于生物信息学的二维形状识别是近期一个新的研究方向,基本思想是把二维形状的轮廓转化为生物信息序列,借助标准的生物信息序列分析工具来进行二维形状的匹配和识别。不过,利用轮廓进行信息序列编码存在编码冗余和编码准确性不高的问题,本文提出了一种新型的结合形状轮廓和骨架的序列编码方法。该方法利用骨架表示形状的细长分支,减少编码的冗余;并分别对轮廓和骨架进行不同类型的编码,具备编码简洁、后续匹配准确性高等优点。最后,本文在三个公开数据集上进行大量的形状识别实验,并与多种通用形状识别方法进行了比较。实验表明,本文方法在多个实验中均取得了较高的识别准确率,相比基本的形状特征描述方法,准确率提高了近5%。   相似文献   

13.
3D目标检测是计算机视觉和自动驾驶中一项重要的场景理解任务。当前基于立体图像的3D目标检测方法大多没有充分考虑多个目标之间的尺度存在较大差异,从而尺度小的物体容易被忽略,导致检测精度低。针对这一问题,提出了一种基于立体图像的多路径特征金字塔网络(MpFPN)3D目标检测方法。MpFPN对特征金字塔网络进行了扩展,增加了自底向上的路径、由上至下的路径及输入特征图到输出特征图之间的连接,为联合区域提议网络提供了更高语义信息和更细粒度空间信息的多尺度特征信息。实验结果表明:在3D目标检测KITTI数据集上,无论在场景简单、中等、复杂情况下,所提方法获得的结果都优于比较方法的结果。   相似文献   

14.
现有的行人重识别方法主要关注于学习行人的局部特征来实现跨摄像机条件下的行人辨识。然而在人体部件存在运动或遮挡、背景干扰等行人数据非完备条件下,会导致行人局部辨识信息丢失概率的增加。针对这个问题,提出了一种多尺度联合学习方法对行人辨识特征进行精细化表达。该方法包含3个分支网络,分别提取行人的粗粒度全局特征、细粒度全局特征和细粒度局部特征。其中粗粒度全局分支通过融合不同层次的语义信息来增强全局特征的丰富性;细粒度全局分支通过联合全部局部特征,在对全局特征进行细粒度描述的同时学习行人局部部件间的相关性;细粒度局部分支则通过遍历局部特征来挖掘行人非显著性的信息以增强局部特征的鲁棒性。为了验证所提方法的有效性,在Market1501、DukeMTMC-ReID和CUHK03三个公开数据集上开展了对比实验,实验结果表明:所提方法取得了最佳性能。   相似文献   

15.
随着水下生物抓取技术的不断发展,高精度的水下物体识别与分割成为了挑战。已有的水下目标检测技术仅能给出物体的大体位置,无法提供物体轮廓等更加细致的信息,严重影响了抓取效率。为了解决这一问题,标注并建立了真实场景水下语义分割数据集DUT-USEG,该数据集包含6 617张图像,其中1 487张具有语义分割和实例分割标注,剩余5 130张图像具有目标检测框标注。基于该数据集,提出了一个关注边界的半监督水下语义分割网络(US-Net),该网络通过设计伪标签生成器和边界检测子网络,实现了对水下物体与背景之间边界的精细学习,提升了边界区域的分割效果。实验表明:所提方法在DUT-USEG数据集的海参、海胆和海星3个类别上相较于对比方法提升了6.7%,达到了目前最好的分割精度。   相似文献   

16.
当前对在线手绘军标图符识别的研究只针对单一类型的手绘点状军标或非规则军标,分别使用不同方法进行识别.但在特殊应用中二者常混合输入,当待识别军标图符的类型未知时,如何识别是一个重要问题.提出一种基于最小生成树(MST)覆盖模型的混合识别方法,训练阶段,分别对点状和非规则军标样本建立MST覆盖模型,并训练一个二分类支持向量机(SVM)分类器;识别阶段,先通过几何和结构信息粗判断军标类型,再通过置信度估计和融合的方法确定未知军标的类型.在113类点状军标和36类非规则军标的数据集中实验,军标类型区分准确率为94.7%,最终识别率为91.6%,且能满足实时要求.   相似文献   

17.
红外诱饵对抗技术的发展使得空战环境日益复杂化,对红外成像制导空空导弹抗干扰目标识别技术提出了更高的要求。红外诱饵的投放使得目标特征的完整性、显著性及稳定性遭到破坏,基于特征融合匹配的统计模式识别方法无法准确识别目标。提出了一种基于朴素贝叶斯分类器的抗干扰目标识别方法,该方法对空战对抗仿真图像数据集进行了特征挖掘,利用实验拟合方法构建了典型特征的概率密度函数模型,构造了朴素贝叶斯分类器,实现了飞机目标和干扰的分类识别。仿真实验结果表明,该方法在已测试的弹道图像数据集下的平均识别正确率达到了81.82%,且能够解决假目标、目标遮挡等抗干扰目标的识别难题。  相似文献   

18.
针对自然条件下人脸表情识别面临遮挡、光照、姿势变化等挑战,存在识别准确率低的问题, 提出了一种新的深度学习网络模型用于人脸表情识别。以ResNet为基础网络,融合了瓶颈注意力机制及全局二阶池化层,其中瓶颈注意力机制专注于表情重要特征的提取,全局二阶池化层度量表情特征之间的相关性,在此基础上通过联合正则化策略,平衡和改善特征数据分布情况,提高表情识别准确率。所提方法在2个公开数据集FER2013和CK+ 进行了测试及验证,最高准确率分别达到了74.227%和95.8%,性能优于诸多现存的主流方法,表明所提模型具有较好的准确性和鲁棒性。   相似文献   

19.
针对目前Anchor-free目标检测方法CenterNet(ObjectsasPoints)生成热力图不准确、检测精度不足的问题,提出了一种基于特征迭代聚合的高分辨率表征网络CenterNet-DHRNet。首先,引入高分辨率表征骨干网络,并用迭代聚合的方式对不同分辨率的特征图进行融合,提高网络的分辨率,有效减少图像在下采样过程中损失的空间语义信息。其次,使用高效通道注意力机制对高分辨率表征骨干网络的输出进行优化。最后,利用结合空洞卷积的空间金字塔池化操作增强网络对不同尺度物体的感受野。实验在PASCALVOC数据集和KITTI数据集上进行,结果表明:CenterNet-DHRNet精度更高,满足实时检测的性能要求,具有良好的鲁棒性。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号