首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 39 毫秒
1.
行人的空间尺度差异是影响行人检测性能的主要瓶颈之一。针对这一问题,提出了跨尺度特征聚合网络(TS-FAN)有效检测多尺度行人。首先,鉴于不同尺度空间呈现出的特征差异性,引入一种基于多路径区域建议网络(RPN)的尺度补偿策略,其在多尺度卷积特征层上自适应地生成一系列与其感受野大小相对应的候选目标尺度集。其次,考虑到不同层次卷积特征在视觉语义上的互补性,提出了跨尺度特征聚合网络模块,其通过横向连接、自上而下路径和由底向上路径,有效地聚合具有语义鲁棒性的高层特征和具有精确定位信息的低层特征,实现对卷积层特征的增强表示。最后,联合多路径RPN尺度补偿策略和跨尺度特征聚合网络模块,构建了一种尺度自适应感知的多尺度行人检测网络。实验结果表明,所提方法与当前一流的行人检测方法TLL-TFA相比,在整个Caltech公开测试数据集上(All:行人高度大于20像素)的行人漏检率降低到26.21%(提高了11.94%),尤其对于Caltech小尺寸行人子数据集上(Far:行人高度在20~30像素之间)的行人漏检率降低到47.30%(提高了12.79%),同时在尺度变化剧烈的ETH数据集上的效果也取得显著提升。   相似文献   

2.
陨石坑是天体表面最为显著的地形特征,传统陨石坑识别方法主要是对小型陨石坑正负样本的二分类问题研究,且效率和精度均不高。以星体宏观视角下的大型陨石坑作为研究对象,结合图像处理和神经网络等方面的知识,创建了来自不同数据源的陨石坑样本数据库,研究了数据源对网络模型泛化能力的影响,提出了一种效率更高的陨石坑多分类识别方法。在非极大值抑制(NMS)算法基础上,提出了一种精度更高的陨石坑检测算法。经过参数优化和实验验证,构建的基于深度学习的多尺度多分类陨石坑自动识别网络框架取得了较高的准确率,在同源验证集上识别率可达0.985,在异源验证集上识别率可达0.863,并且有效改善了目标检测时检测框冗余及误检测的问题。   相似文献   

3.
红外弱小目标检测技术是红外探测系统的核心技术之一。针对远距离复杂场景下红外弱小目标对比度低、信噪比低和纹理特征稀疏分散导致目标检测率低的问题,提出一种融合注意力机制和改进YOLOv3的红外弱小目标检测算法。首先,在YOLOv3的基础上,用更大尺度的检测头替换最小尺度的检测头,在保证推理速度的基础上有效提升了红外图像中小目标的检测概率。然后,在检测头之前设计了Infrared Attention模块,通过通道间的信息交互,抽取出更加关键重要的信息供网络学习。最后,用完全交并比损失(Complete IoU Loss)替代交并比损失(Intersection over Union Loss)来衡量预测框的检测能力,通过梯度回传实现更好的模型训练。实验结果表明,本文提出的YOLOv3-DCA 能完成多种场景下红外弱小目标的检测任务,且检测准确率、召回率、F1和平均准确率分别达到91.84%、88.85%、93%和88.82%,平均准确率比YOLOv3基线提升约7%,与主流的SSD、CenterNet和YOLOv4模型对比平均准确率也取得了目前最优。  相似文献   

4.
目标检测技术广泛应用于交通、医疗、安保和航天等领域.目前,目标检测技术面临目标微弱、背景复杂、目标被遮挡等挑战[1].针对星表非结构化模拟地形采集的图像中岩石和石块小目标检测识别率低、误识别率高的问题,研究了当下效果最好、模型轻量化的YOLOv5目标检测算法,在其基础上进行改进优化器与优化检测框重复检测效果的一种满足实时性要求的岩石目标检测算法.具体通过引入空标签负样本、结合随机梯度下降法SGD(stochastic gradient descent)优化模型和非极大值抑制参数调节方法,提升YOLOv5网络模型的特征描述能力和分类准确率.利用在地面试验场采集的复杂地形图像作为数据集,并采用mAP(mean average pre-cision)、画面每秒传输帧数(FPS)、准确率和召回(P-R)曲线等作为性能指标,对所提出的目标检测网络进行了试验验证.结果 表明本文提出的改进网络拥有更高的准确率和更低的虚警率,同时保持原有算法的实时性.  相似文献   

5.
行人再识别是图像检索领域的一个重要部分,但是由于行人姿态各异、背景复杂等因素,导致提取到的行人特征鲁棒性和代表性不强,进而影响行人再识别的精度。在AlignedReID++算法基础上,提出了基于空间注意力机制的行人特征提取方法,应用在行人再识别中取得了很好的效果。首先,在特征提取部分,引入空间注意力机制来增强特征表达,同时抑制可能的噪声;其次,通过在卷积层中引入实例正则化层(IN)来辅助批正则化层(BN)对特征进行归一化处理,解决单一BN层对特征色调变化以及光照变化的不敏感性,提高特征提取对亮度、色调变化的鲁棒性;最后,在Market1501、DukeMTMC和CUHK03 3个行人再识别通用数据集上对所提改进模型进行测试评价。实验结果显示:改进后的模型在3个数据集上识别精度分别提升了2%、2.9%和5.1%,表明改进后的模型相较于改进前的模型,在精度以及鲁棒性上都有显著提高。   相似文献   

6.
针对复杂场景下的人眼检测问题,间接方法和直接方法具有一定的局限性。提出了一种不依赖人脸检测的直接型人眼检测算法,以解决复杂场景下多尺度尤其是小尺度人眼检测问题。算法通过减少下采样因子并加入扩张残差单元以提升小尺度人眼检测能力,且对多尺度特征相互拼接以保证多尺度人眼检测的精度。同时,算法借助于压缩特征输出通道降低了模型复杂度,使人眼检测效率得以提升。实验结果表明:所提模型可以在小尺度下有效地进行左右眼区分,并在红外数据上表现良好。经在DIF数据集上进行训练与测试,所提模型在较小尺度下人眼检测精度达到82.59%,检测效率达到30.5 fps。   相似文献   

7.
目标检测作为计算机视觉领域的热点问题,目前基于深度学习的目标检测方法可以分为2类:两步检测和一步检测,前者有着较高准确性,后者有着较好速度,但是为提高检测的性能两者都引入了锚机制。为提高目标检测系统的性能,基于深度卷积神经网络的两步检测算法引入了注意力引导(AG)模块,通过对候选区域网络(RPN)的锚机制进行引导,使得对于预选锚框形状的选择更具有多样性;同时针对传统的后处理方式非极大值抑制(NMS)算法存在的误检和漏检的问题,提出了一种置信度因子的NMS(Cf-NMS)算法,对于模型的整体性能有着很大的贡献。实验结果说明,所提方法虽然在速度性能上有略微的下降,但是无论是在RPN变体还是现有的先进算法在准确性方面都有提升。   相似文献   

8.
复杂动态场景下目标检测与分割算法   总被引:1,自引:1,他引:0  
在动态场景等复杂条件下,往往难以对序列图像目标进行准确的检测与分割。根据序列图像中目标在复杂条件下的成像特点,提出了一种基于融合尺度不变特征变换(SIFT)流特征显著模型的动态场景目标检测与分割算法。通过对SIFT流算法表示运动特征信息的优势进行分析,并结合图像国际照明协会(CIE)Lab颜色空间的颜色和亮度特征信息,建立四维特征向量空间。利用改进的多尺度中心-环绕对比方法生成各特征通道的显著图并进行线性融合,建立序列图像的动态场景目标显著模型。最后利用均值漂移聚类算法和形态学处理实现对检测目标的精确分割。实验结果表明,相比传统检测与分割算法,该算法在动态背景与航拍等复杂场景下能够分割出更为完整的目标区域,具有良好的鲁棒性和高分割精度。   相似文献   

9.
现有的行人重识别方法主要关注于学习行人的局部特征来实现跨摄像机条件下的行人辨识。然而在人体部件存在运动或遮挡、背景干扰等行人数据非完备条件下,会导致行人局部辨识信息丢失概率的增加。针对这个问题,提出了一种多尺度联合学习方法对行人辨识特征进行精细化表达。该方法包含3个分支网络,分别提取行人的粗粒度全局特征、细粒度全局特征和细粒度局部特征。其中粗粒度全局分支通过融合不同层次的语义信息来增强全局特征的丰富性;细粒度全局分支通过联合全部局部特征,在对全局特征进行细粒度描述的同时学习行人局部部件间的相关性;细粒度局部分支则通过遍历局部特征来挖掘行人非显著性的信息以增强局部特征的鲁棒性。为了验证所提方法的有效性,在Market1501、DukeMTMC-ReID和CUHK03三个公开数据集上开展了对比实验,实验结果表明:所提方法取得了最佳性能。   相似文献   

10.
跨域是行人重识别的重要应用场景,但是源域与目标域行人图像在光照条件、拍摄视角、成像背景与风格等方面的表观特征差异性是导致行人重识别模型泛化能力下降的关键因素。针对该问题,提出了基于多标签协同学习的跨域行人重识别方法。利用语义解析模型构造了基于语义对齐的多标签数据表示,以引导构建更关注行人前景区域的局部特征,达到语义对齐的目的,减少背景对跨域重识别的影响。基于行人图像全局特征和语义对齐后的行人局部特征,利用协同学习平均模型生成行人重识别模型的多标签表示,减少跨域场景下噪声硬标签的干扰。利用协同学习网络框架联合多标签的语义对齐模型,提高行人重识别模型的识别能力。实验结果表明:在Market-1501→ DukeMTMC-reID、DukeMTMC-reID→Market-1501、Market-1501→MSMT17、DukeMTMC-reID→MSMT17跨域行人重识别数据集上,与NRMT方法相比,平均精度均值分别提高了8.3%、8.9%、7.6%、7.9%,多标签协同学习方法具有显著的优越性。   相似文献   

11.
3D目标检测是计算机视觉和自动驾驶中一项重要的场景理解任务。当前基于立体图像的3D目标检测方法大多没有充分考虑多个目标之间的尺度存在较大差异,从而尺度小的物体容易被忽略,导致检测精度低。针对这一问题,提出了一种基于立体图像的多路径特征金字塔网络(MpFPN)3D目标检测方法。MpFPN对特征金字塔网络进行了扩展,增加了自底向上的路径、由上至下的路径及输入特征图到输出特征图之间的连接,为联合区域提议网络提供了更高语义信息和更细粒度空间信息的多尺度特征信息。实验结果表明:在3D目标检测KITTI数据集上,无论在场景简单、中等、复杂情况下,所提方法获得的结果都优于比较方法的结果。   相似文献   

12.
针对目前Anchor-free目标检测方法CenterNet(ObjectsasPoints)生成热力图不准确、检测精度不足的问题,提出了一种基于特征迭代聚合的高分辨率表征网络CenterNet-DHRNet。首先,引入高分辨率表征骨干网络,并用迭代聚合的方式对不同分辨率的特征图进行融合,提高网络的分辨率,有效减少图像在下采样过程中损失的空间语义信息。其次,使用高效通道注意力机制对高分辨率表征骨干网络的输出进行优化。最后,利用结合空洞卷积的空间金字塔池化操作增强网络对不同尺度物体的感受野。实验在PASCALVOC数据集和KITTI数据集上进行,结果表明:CenterNet-DHRNet精度更高,满足实时检测的性能要求,具有良好的鲁棒性。   相似文献   

13.
为了实现激光雷达点云与图像重建点云的三维空间配准,基于自研三维扫描激光雷达系统,提出了新型的快速多尺度因子(FMSR)点云配准算法,研究了空间点云配准技术。该算法主要包括初始配准和精确配准2个步骤:初始配准使用基于尺度自适应关键点质量(ASKQ)的点云特征提取算法,提取关键点的特征匹配对,求解点云配准初始参数;精确配准利用K-邻近(KNN)算法全局搜索,提升计算效率,多次迭代得到2组点云之间的最优旋转矩阵、最优平移向量和最优尺度因子。仿真和实验结果表明,所提出的算法对空间目标(尺寸为20.30 m×7.85 m×26.56 m)实现空间点云配准,配准精度达到0.194 m,运行时间为16.207 s;与多尺度迭代最近点(S-ICP)算法相比,配准精度提高了0.131 m,运行时间提高了30%。所提出的空间点云配准技术可为场景重建和纹理匹配提供算法基础。   相似文献   

14.
基于EfficientDet的无预训练SAR图像船舶检测器   总被引:1,自引:0,他引:1  
针对多尺度、多场景的合成孔径雷达(SAR)图像船舶检测问题,提出了一种基于EfficientDet的无预训练目标检测器。现有的基于卷积神经网络的SAR图像船舶检测器并没有表现出其应有的出色性能。重要原因之一是依赖分类任务的预训练模型,没有有效的方法来解决SAR图像与自然场景图像之间存在的差异性;另一个重要原因是没有充分利用卷积神经网络各层的信息,特征融合能力不够强,难以处理包括海上和近海在内的多场景船舶检测,尤其是无法排除近海复杂背景的干扰。SED就这2个方面改进方法,在公开SAR船舶检测数据集上进行实验,检测精度指标平均准确率(AP)达到94.2%,与经典的深度学习检测器对比,超过最优的RetineNet模型1.3%,在模型大小、算力消耗和检测速度之间达到平衡,验证了所提模型在多场景条件下多尺度SAR图像船舶检测具有优异的性能。   相似文献   

15.
为了提高视频卫星对运动车辆的检测质量,在经典视觉背景提取器(ViBE)算法的基础上,结合遥感的面向对象分类技术,从提升正确检测运动目标数量和抑制虚假运动目标检测数量两个方面着手,提出了一种新的运动车辆检测方法(VOMVD)。首先通过优化ViBE模型参数,尽可能多地获取真实运动目标,但这在一定程度引入了许多的虚假目标。研究继而依据影像上地面小尺度运动目标和道路的依存关系,采用面向对象的分类方法,基于光谱、纹理、空间属性,构建了均值、标准差、卷积核内平均灰度值、卷积核内平均信息熵、面积、长度、紧密度、延伸度等8个特征,用于提取道路信息,以此掩膜ViBE提取的虚假运动目标和伪运动目标。结果表明,基于本研究提出的视频卫星运动目标检测方法较之三帧差分法、ViBE检测方法等,其精度有明显提升。在本研究中,三帧差分法、ViBE和VOMVD对运动目标的检测精度P分别为70.91%,61.49%和85.71%,召回率R分别为84.78%,98.91%和97.83%,F值分别为77.23%,75.83%和91.37%,有效提升了方法对运动目标的检测效果。  相似文献   

16.
在室外监控视频的场景下,由于场景的复杂性及目标的多样性,监控视频中的目标存在难以检测的情况,如目标被遮挡、目标尺寸变化等,目标检测任务仍然存在挑战。基于此,提出了一种利用运动信息引导基于卷积神经网络的目标检测算法来提高目标检测的准确率。对运动目标检测算法进行一定的改进,使得到的运动前景图中能够保持静止目标前景的存在;利用运动前景图中的前景可以指示目标空间位置的特点,在特征层面将网络提取的特征图与获取的以运动前景图为主的运动信息相融合,提高特征图可能存在目标区域的响应值;在目标检测算法的检测器中,引入一个定位分支,利用视频帧的运动前景图,学习候选目标的定位置信度,并与目标的分类置信度加权求和,作为目标最终的置信度,再通过非极大值抑制方法得到检测结果。实验证明,在固定摄像机下采集的数据集中,所提算法能够提升目标检测的准确率。   相似文献   

17.
高速道路动态执法要求车道检测算法能够结构化解析道路,但是基于传统手工设计特征的车道检测算法准确率和召回率不足,而基于深度学习的算法又对计算资源要求太高,因此提出基于道路特征信息的车道结构化解析算法。利用边缘点的梯度统计信息筛选Hough空间的候选点,用动态规划的方法在剩余的Hough空间候选点中寻找最合理的车道线组合,能够在较少计算资源的平台上准确地检测到道路上的全部车道。在自有数据的检测实验中,所提算法能够准确定位结构化和非结构化道路;在对比实验中,所提算法在准确率、召回率和计算速度上均比同类算法有所提高。   相似文献   

18.
针对交互式多模型(IMM)故障诊断方法固定模型转移概率导致的诊断准确性、速度下降和估计精度损失问题,提出了一种基于模型转移概率和模型概率修正的故障诊断方法,并与粒子滤波(PF)结合实现了风机变桨系统传感器的多故障诊断。在非模式切换阶段,采用后验模型概率梯度信息设计模型转移概率的修正函数,以抑制噪声对IMM估计精度的影响;在模式切换阶段,采用模型概率反转的策略快速切换模型,弥补模型软切换导致的诊断延迟和错误诊断。通过仿真实验证明所提方法的准确性、模型切换速度以及状态估计精度都得到了较好的提升。   相似文献   

19.
为解决航空发动机部件表面缺陷检测精度低、检测速度慢的问题,提出一种改进的YOLOv4算法进行智能检测。在路径聚合网络(PANet)结构中融合浅层特征与深层特征,增大特征检测尺度,同时去除自下而上的路径增强结构,提高小目标检测精度和整体检测速度;根据各类缺陷数量不同的情况,优化聚焦损失中的平衡参数,增加权重因子调节各类缺陷的损失权重,将改进后的聚焦损失代替分类误差中的交叉熵损失函数,降低样本不平衡和难易样本对检测精度的影响。实验表明:相比于原始YOLOv4算法,改进后的YOLOv4算法在测试集上的平均精度均值(mAP)为90.10%,提高了2.17%;检测速度为24.82 fps,提高了1.58 fps,检测精度也高于单发多框检测(SSD)算法、EfficientDet算法、YOLOv3算法和YOLOv4-Tiny算法。  相似文献   

20.
行人重识别是计算机视觉领域的一个重要部分,但是容易受到行人图片实际采集环境的影响,导致行人特征表达不充分,进一步导致模型精度不高。提出一种基于注意力机制和条件卷积改进的行人重识别方法,使行人特征得到更充分的表达。将注意力机制引入特征提取网络ResNet50中,对输入图像空间和通道上的关键信息进行加权强化,同时抑制可能的噪声;将条件卷积模块引入主干网络,动态调整卷积核参数,使模型能够在保持高效推理的同时提高容量和性能;利用Market1501、MSMT17和DukeMTMC-ReID主流数据集对改进方法进行评估,Rank1分别提升1.1%、2.4%、1.3%,mAP分别提升0.5%、2.3%、1.3%,结果表明:改进方法能够使行人特征得到更好的表达,识别精度得到提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号