首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 281 毫秒
1.
水下监控视频中的珊瑚礁鱼检测面临着视频成像质量不高、水下环境复杂、珊瑚礁鱼视觉多样性高等困难,是一个极具挑战的视觉目标检测问题,如何提取高辨识度的特征成为制约检测精度提升的关键。提出了一种时空特征聚合的水下珊瑚礁鱼检测方法,通过设计视觉特征聚合和时序特征聚合2个模块,融合多个维度的特征以实现这一目标。前者设计了自顶向下的切分和自底向上的归并方案,可实现不同分辨率多层卷积特征图的有效聚合;后者给出了一种帧差引导的相邻帧特征图融合方案,可通过融合多帧特征图强化运动目标及其周边区域的特征表示。公开数据集上的实验表明:基于以上2个模块设计的时空特征聚合网络可以实现对水下珊瑚礁鱼的有效检测,相比于多个主流方法和模型取得了更高的检测精度。   相似文献   

2.
基于光学图像对失效卫星部件的精确检测可以为失效卫星的定位与捕获等任务提供支撑。然而,失效卫星部件多为密集小目标,且其光照条件变化较大,这导致一般主干网络出现特征表征分辨率低,小目标漏检等问题。针对上述问题,提出了一种基于改进Faster R-CNN的失效卫星部件检测方法。该方法在Faster R-CNN的基础上,融合高分辨网络构建新的特征提取主干网络,以获得可靠、高分辨率的特征表达式。其次,在模拟真实空间环境的条件下,利用1:1的嫦娥卫星模型构建了一个信息丰富的失效卫星数据集。用该数据集进行验证,结果表明:本文方法的平均精度为93.6%,其与Faster R-CNN和Cascade R-CNN相比,对小部件检测的准确率与召回率分别平均提高了9.8%与5.4%。该方法可有效检测失效卫星部件。  相似文献   

3.
基于深度学习的目标检测算法通常需要使用非极大值抑制等后处理方法对预测框进行筛选,无法在行人拥挤的场景下平衡模型的检测精度和召回率。虽然迭代检测的方法可以解决非极大值抑制等方法带来的问题,但是重复检测同样会限制模型的性能。提出了一种历史信息特征敏感的行人迭代检测方法。引入带权重的历史信息特征(WHIC),提高特征的区分度;利用历史信息特征提取模块(HIFEM)得到不同尺度的历史信息特征,并融合进主网络中进行多尺度检测,增强了模型对历史信息特征的敏感度,有效抑制重复检测框的产生。实验结果表明:所提方法在拥挤场景的行人检测数据集CrowdHuman和WiderPerson上取得了最优的检测精度和召回率。  相似文献   

4.
基于跨尺度特征聚合网络的多尺度行人检测   总被引:1,自引:1,他引:0  
行人的空间尺度差异是影响行人检测性能的主要瓶颈之一。针对这一问题,提出了跨尺度特征聚合网络(TS-FAN)有效检测多尺度行人。首先,鉴于不同尺度空间呈现出的特征差异性,引入一种基于多路径区域建议网络(RPN)的尺度补偿策略,其在多尺度卷积特征层上自适应地生成一系列与其感受野大小相对应的候选目标尺度集。其次,考虑到不同层次卷积特征在视觉语义上的互补性,提出了跨尺度特征聚合网络模块,其通过横向连接、自上而下路径和由底向上路径,有效地聚合具有语义鲁棒性的高层特征和具有精确定位信息的低层特征,实现对卷积层特征的增强表示。最后,联合多路径RPN尺度补偿策略和跨尺度特征聚合网络模块,构建了一种尺度自适应感知的多尺度行人检测网络。实验结果表明,所提方法与当前一流的行人检测方法TLL-TFA相比,在整个Caltech公开测试数据集上(All:行人高度大于20像素)的行人漏检率降低到26.21%(提高了11.94%),尤其对于Caltech小尺寸行人子数据集上(Far:行人高度在20~30像素之间)的行人漏检率降低到47.30%(提高了12.79%),同时在尺度变化剧烈的ETH数据集上的效果也取得显著提升。   相似文献   

5.
单声道歌声分离是指将单声道歌曲中的伴奏和歌声分离,在旋律提取、歌词识别、卡拉OK伴奏等方面有重要应用。针对当前时频谱图预测精度受限的问题,利用高分辨率网络具有并行结构及特征充分交互提高模型性能的优势,提出基于高分辨率网络的单声道歌声分离算法。设计并构建适合单声道歌声分离的高分辨率网络,输入歌曲的时频谱图到网络,得到预测的伴奏和歌声时频谱图。结合歌曲相位进行重构,得到伴奏和歌声的时域信号。实验表明,在公开数据集MIR-1K上,所提算法的SNR、SIR、SAR指标均优于当前代表性算法,提高了分离后伴奏和歌声的质量。   相似文献   

6.
变化检测(CD)是遥感的一项重要任务,通常面临许多伪变化和较大的尺度变化。目前的方法主要侧重于对差异特征的建模,忽略了从原始图像中提取足够的信息,影响了特征的识别能力,难以稳定地区分出变化区域。针对以上问题,提出了一种全尺度特征聚合网络(FFANet)来更充分地利用原始图像特征,促使生成的特征表示在语义上更丰富、在空间上更准确,从而提高了网络对小目标和目标边缘的检测性能。同时,拓展了深监督来结合多尺度的预测图,以促使不同对象在更合适的尺度上进行检测,从而提升了网络对对象尺度变化的鲁棒性。在CDD数据集上,相比于基线网络,所提方法仅增加了1.01×106的参数量,就将F1分数提升了0.034。  相似文献   

7.
为解决航空发动机在安装过程中大多实行人工安装、定位不精确等问题,在研究其自动化安装方法中,针对航空发动机安装工位的检测需求,提出了一种残差网络与膨胀卷积相融合的SSD改进算法(R-D SSD)。将经典SSD模型的主干网络VGG16替换为残差网络ResNet-101,并增加其输出特征图上的预选框数量,解决了原始算法对底层特征抓取能力不足的问题,进而弥补了对小目标检测效果较差的缺陷;利用膨胀卷积扩大网络的感受野,获取足够的安装工位边缘特征细节信息,在不改变网络结构的同时,保证了模型良好的实时性和对目标的检测精度。实验表明:对于小目标数据集和整个数据集,R-D SSD算法的平均检测精度较原始算法分别提高了8.6%和4.0%,可以满足航空发动机安装时平均检测精度不低于85%的要求。   相似文献   

8.
基于深度学习的图像超分辨率(SR)重建方法主要通过增加模型的深度来提升图像重建的质量,但同时增加了模型的计算代价,很多网络利用注意力机制来提高特征提取能力,但难以充分学习到不同区域的特征。为此,提出一种基于期望最大化(EM)自注意力残差的图像超分辨率重建网络。该网络通过改进基础残差块,构建特征增强残差块,以更好地复用残差块中所提取的特征。为增加特征信息在空间上的相关性,引入EM自注意力机制,构建EM自注意力残差模块来增强模型中每个模块的特征提取能力,并通过级联EM自注意力残差模块来构建整个模型的特征提取结构。所获得的特征图通过上采样的图像重建模块获得重建的高分辨率图像。将所提方法与主流方法进行实验对比,结果表明:所提方法在5个流行的SR测试集上能够取得较好的主观视觉效果和更优的性能指标。  相似文献   

9.
基于改进Faster R-CNN的SAR图像飞机检测算法   总被引:1,自引:1,他引:0  
在合成孔径雷达(SAR)图像分析领域,飞机作为一种重要目标,对其的检测越来越受到重视。针对传统SAR图像飞机检测算法需要人工设计特征且鲁棒性较差的问题,提出了一种基于改进Faster R-CNN的SAR图像飞机检测算法。制作了一个SAR图像飞机数据集(SAD),以Faster R-CNN为检测框架,利用改进k-means算法设计更合理的先验锚点框,以适应飞机目标的形状特点;借鉴inception模块思想,设计多路不同尺寸卷积核以扩展网络宽度,增强对浅层特征的表达;分析残差网络Layer5层的特征输出具有更大的感受野,对其上采样后进行特征融合以利用更多的上下文信息;同时引入Mask R-CNN算法中提出的RoI Align单元,消除特征图与原始图像的映射偏差。实验结果表明:相比原始的Faster R-CNN算法,所提改进的Faster R-CNN算法在SAR图像飞机数据集上平均检测精度提高了7.4%,同时保持了较快的检测速度。   相似文献   

10.
针对全卷积孪生网络(SiamFC)在相似物体干扰及目标发生大尺度外观变化时容易跟踪失败的问题,提出了一种基于级联注意力机制的孪生网络视觉跟踪算法。首先,在网络的最后一层加入非局部注意力模块,从空间维度得到关于目标区域的自注意特征图,并与最后一层特征进行相加运算。其次,考虑到不同通道特征对不同目标和各类场景的响应差异,引入通道注意力模块实现对特征通道的重要性选择。为了进一步提高跟踪的鲁棒性,将其与SiamFC算法进行加权融合,得到最终的响应图。最后,将提出的孪生网络模型在GOT10k和VID数据集上进行联合训练,进一步提升模型的表达力与判别力。实验结果表明:所提算法相比于SiamFC,在跟踪精度上提高了9.3%,在成功率上提高了5.4%。   相似文献   

11.
Applications including change detection, disaster management, and urban planning require precise building information, and therefore automatic building extraction has become a significant research topic. With the improvements in sensor and satellite technologies, more data has become available, and with the increased computational power, deep learning methods have emerged as successful tools. In this study, U-Net and FPN architectures using four different backbones (ResNet-50, ResNeXt-50, SE-ResNext-50, and DenseNet-121), and an Attention Residual U-Net approach were used for building extraction from high-resolution aerial images. Two publicly available datasets, Inria Aerial Image Labeling Dataset and Massachusetts Buildings Dataset were used to train and test the models. According to the results, Attention Residual U-Net model has the highest F1 score with 0.8154, IoU score with 0.7102, and test accuracy with 94.51% on the Inria dataset. On the Massachusetts dataset, FPN Dense-Net-121 model has the highest F1 score with 0.7565 and IoU score with 0.6188, and Attention Residual U-Net model has the highest test accuracy with 92.43%. It has been observed that, FPN with DenseNet backbone can be a better choice when working with small size datasets. On the other hand, Attention Residual U-Net approach achieved higher success when a sufficiently large dataset is provided.  相似文献   

12.
本文针对无人机航拍目标检测技术中目标聚集、目标较小及实时性差等问题,将YOLO V5的主干架构进行改进,简化Neck网络,提出了一种提高检测速度又能准确识别的无人机航拍图像检测技术方案。经过仿真实验测试,改进后的YOLO V5网络在保持识别精度的同时,检测速率提升了31%,满足无人机在航拍作业时对于准确性与实时性的要求。  相似文献   

13.
3D目标检测是计算机视觉和自动驾驶中一项重要的场景理解任务。当前基于立体图像的3D目标检测方法大多没有充分考虑多个目标之间的尺度存在较大差异,从而尺度小的物体容易被忽略,导致检测精度低。针对这一问题,提出了一种基于立体图像的多路径特征金字塔网络(MpFPN)3D目标检测方法。MpFPN对特征金字塔网络进行了扩展,增加了自底向上的路径、由上至下的路径及输入特征图到输出特征图之间的连接,为联合区域提议网络提供了更高语义信息和更细粒度空间信息的多尺度特征信息。实验结果表明:在3D目标检测KITTI数据集上,无论在场景简单、中等、复杂情况下,所提方法获得的结果都优于比较方法的结果。   相似文献   

14.
地磁匹配导航技术是一种重要的辅助导航制导方法,地磁基准图的构建精度对地磁匹配制导的精准度起着决定性作用。针对现有地磁基准图构建精度难以满足实际地磁匹配导航需求的问题,提出了一种基于卷积神经网络的地磁基准图构建方法。首先,利用卷积层提取低分辨率基准图中的特征图像块;然后,利用基于学习的阈值收缩算法(LISTA)实现图像块的稀疏表示;最后,利用三通道的地磁信息得到重建后的高分辨率基准图。实验结果表明:所提方法对地磁基准图具有更高的构建精度,同时对噪声有更好的鲁棒性,各种客观评价指标均高于现有的超分辨率重建方法。   相似文献   

15.
为实现公安监控系统内容分析的精准智能及提高服务实战能力,提出一种轻量化的多目标实时检测算法。首先,基于CenterNet检测网络增加了CBNet的多融合阶梯级联结构,有效地解决了主干网络在日常监控中特征提取能力不足的问题;其次,通过模型剪枝压缩网络减少参数量,加快了监控视频分析速度。本文利用部分COCO数据集和自行采集的现场数据进行训练与测试,并与其他主流检测算法(YOLO、Faster-RCNN、SSD等)进行消融实验。实验结果表明:所提模型在公共安全监控中能有效地做到速度与精度的均衡,并具有较强的普适性。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号