首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
针对无人机航拍图像尺度变化大、识别难度大和目标普遍较小的问题,提出一种基于改进单阶段多框检测器(single shot multibox detector, SSD)的无人机航拍目标检测算法——RCBnet.该算法为了提升网络的特征提取能力,将SSD算法的特征提取网络修改为Resnet-50并采用特征融合的方式,将特征图进行融合,用融合后的特征图构建特征金字塔;为了增强算法对物体的检测能力,设计一种联合注意力机制的多尺度卷积结构来有效调节感受野,实现不同尺寸卷积核对特征图的并行运算;针对训练过程中正负样本极具不平衡的问题,该算法采用Focal Loss损失函数训练网络模型,使其侧重于困难样本.通过与其他经典算法相比可知,所提算法在无人机航拍图像中具有更高的检测精度、更好的检测性能和鲁棒性,相比SSD,精度提高达3.46%.  相似文献   

2.
针对复杂场景下的人眼检测问题,间接方法和直接方法具有一定的局限性。提出了一种不依赖人脸检测的直接型人眼检测算法,以解决复杂场景下多尺度尤其是小尺度人眼检测问题。算法通过减少下采样因子并加入扩张残差单元以提升小尺度人眼检测能力,且对多尺度特征相互拼接以保证多尺度人眼检测的精度。同时,算法借助于压缩特征输出通道降低了模型复杂度,使人眼检测效率得以提升。实验结果表明:所提模型可以在小尺度下有效地进行左右眼区分,并在红外数据上表现良好。经在DIF数据集上进行训练与测试,所提模型在较小尺度下人眼检测精度达到82.59%,检测效率达到30.5 fps。   相似文献   

3.
多源遥感数据具有互补性和协同性,近年来,基于深度学习的方法已经在多源遥感图像分类中取得了一定进展,但当前方法仍面临关键难题,如多源遥感图像特征表达不一致,融合困难,基于静态推理范式的神经网络缺乏对不同类别地物的适应性。为解决上述问题,提出了基于跨模态Transformer和多尺度动态3D卷积的多源遥感图像分类模型。为提高多源特征表达的一致性,设计了基于Transformer的融合模块,借助其强大的注意力建模能力挖掘高光谱和LiDAR数据特征之间的相互作用;为提高特征提取方法对不同地物类别的适应性,设计了多尺度动态3D卷积模块,将输入特征的多尺度信息融入卷积核的调制,提高卷积操作对不同地物的适应性。采用多源遥感数据集Houston和Trento对所提方法进行验证,实验结果表明:所提方法在Houston和Trento数据集上总体准确率分别达到94.60%和98.21%,相比MGA-MFN等主流方法,总体准确率分别至少提升0.97%和0.25%,验证了所提方法可有效提升多源遥感图像分类的准确率。  相似文献   

4.
基于迁移学习的卷积神经网络SAR图像目标识别   总被引:2,自引:0,他引:2  
针对卷积神经网络中因网络参数随机初始化和参数过多导致的收敛速度慢及过拟合的问题,提出了一种基于迁移学习监督式预训练的卷积神经网络。首先,引入迁移学习的思想,采用小规模数据集作为源域的训练样本,针对源域中源任务进行监督式训练得到预训练模型;然后,构建一个多层的卷积神经网络作为目标域中目标任务的待训练网络,将源域中获得的预训练模型作为该网络的初始参数,大规模数据作为目标域的训练样本进行网络的微调,通过这种基于特征选择的迁移学习,实现源域到目标域的特征信息迁移;针对卷积神经网络中全连接层参数过多的问题,采用卷积层替代全连接层。试验使用美国国防高等研究计划署的移动与静止目标搜索识别(Moving and Stationary Target Acquisition and Recognition,MSTAR)数据集中三类目标数据作为源域样本,十类目标数据作为目标域样本,结果表明该算法的十类目标识别精度达到了99.13%,且具有更快的误差收敛速度。  相似文献   

5.
基于多尺度梯度及深度神经网络的汉字识别   总被引:1,自引:0,他引:1  
介绍了一种基于多尺度滑动窗的方法提取文字的梯度直方图特征,并结合深度神经网络对印刷体汉字进行识别.针对梯度直方图的空间关系,使用可伸缩的滑动窗对图像进行分割,在不同尺度上获取文字的特征信息,有效融合汉字的全局特征和局部分块特征.实验采用5层的深度神经网络模型对国标一级3755个印刷体汉字进行分类,并应用Dropout技术防止训练过拟合,提高神经网络的泛化能力.实验准确率达到98.292%,有较好的识别性能,验证了本文多尺度梯度特征及深度神经网络模型在文字识别上的有效性.   相似文献   

6.
目标检测网络SSD的多层回归特征图存在各层回归计算之间相对独立的问题,且基于SSD改进的系列算法在提高检测精度的同时难以兼顾实时性。针对上述问题,提出一种基于异步卷积分解与分流(shunt)结构的单阶段目标检测器。基于异步卷积分解算法设计了一种shunt结构,交错连接多层特征图,增强了回归计算之间的统一性与协调性。优化了原有高层主流结构,在主流结构与shunt结构中分别用最大池化和异步卷积分解2种不同的方式对特征图大小进行降维,保留空间相关信息的同时提高了特征的多样性。实验结果表明,将VOC2007trainval和VOC2012trainval中的图片统一缩小至300像素×300像素进行训练,提出的目标检测器在VOC2007test上进行检测时的平均精度均值可达到80.5%,检测速度超过30帧/s。   相似文献   

7.
3D目标检测是计算机视觉和自动驾驶中一项重要的场景理解任务。当前基于立体图像的3D目标检测方法大多没有充分考虑多个目标之间的尺度存在较大差异,从而尺度小的物体容易被忽略,导致检测精度低。针对这一问题,提出了一种基于立体图像的多路径特征金字塔网络(MpFPN)3D目标检测方法。MpFPN对特征金字塔网络进行了扩展,增加了自底向上的路径、由上至下的路径及输入特征图到输出特征图之间的连接,为联合区域提议网络提供了更高语义信息和更细粒度空间信息的多尺度特征信息。实验结果表明:在3D目标检测KITTI数据集上,无论在场景简单、中等、复杂情况下,所提方法获得的结果都优于比较方法的结果。   相似文献   

8.
遥感图像中存在飞机很小、角度和位置不确定且背景复杂等问题,从遥感图像中检测飞机是一项重要且具有挑战性的任务,因此,提出一种基于超像素与多尺度残差U-Net(Multi-scale Residual U-Net,MSRU-Net)相结合的遥感图像飞机检测方法。首先对遥感图像进行超像素预分割,将位置相邻且像素特征相似的像素点组成若干个超像素,保持图像进一步分割的有效特征;然后构建多尺度残差U-Net,学习其多尺度判别特征。与传统的飞机检测方法相比,该方法用少量的超像素代替大量像素表达图像特征,降低了图像分割的复杂度,再利用MSRU-Net分割遥感超像素图像,有效检测不同尺度的飞机图像。在公共飞机遥感图像数据集上实验,结果表明,该方法能够有效的检测遥感图像不同尺度的飞机图像,检测精确率达到91.2 %。  相似文献   

9.
目前的频谱感知算法以模型驱动为主,其感知性能过于依赖预定的统计模型,这使得其在信道环境复杂的卫星通信场景中的部署变得困难。对LEO卫星过境期间的信噪比波动情况进行分析,结果显示信噪比的波动达到14 dB。针对该复杂场景提出了一种基于双向长短期记忆网络及贝叶斯似然比检验联合的频谱感知算法。该算法不需要任何主信号的先验知识,可自动从主信号中学习隐藏特征并做出决策。基于Neyman-Pearson准则,在神经网络输出端设计了一种基于阈值的检测方案,可方便地控制恒定的虚警概率。仿真结果表明,所提算法在信噪比为–14 dB的情况下,仍能达到83%的检测性能,且始终优于卷积神经网络、多层感知机和基于模型驱动的能量检测算法。  相似文献   

10.
在遥感图像目标检测领域内,旋转物体的检测存在挑战,卷积神经网络在提取信息时会受制于固定的空间结构,采样点无法聚焦于目标;遥感图像尺度变化大,不同物体需要具有不同尺度感受野的特征映射,具有单一尺度感受野的特征映射无法包含所有有效信息。基于此,提出了可变形对齐卷积,根据候选边框调节采样点,并根据特征映射学习采样点的细微偏移,使采样点聚焦于目标,从而实现动态特征选择;同时提出了基于可变形对齐卷积的感受野自适应模块,对具有不同尺度感受野的特征映射进行融合,自适应地调整神经元的感受野。在公开数据集上的大量实验验证了所提算法可以提高遥感图像目标检测的精度。   相似文献   

11.
This paper proposes a novel ship wake detection algorithm based on the White Top-hat Transform (WTHT) and the Radon transform, which aims to improve the contrast between the ship wake and the background so as to improve the detection performance on Synthetic Aperture Radar (SAR) images. The proposed algorithm includes two major processes, and one is to improve the contrast and another one is to locate the ship wake. In high sea state conditions, the contrast of ship wake and background can be very low, which makes it difficult to detect. In the first step, the proposed contrast improvement algorithm is applied to improving the contrast which helps for improving the detection performance. An attribute filter based on edge detection result is adopted here. In the second step the contrast improved image is transformed into the Radon domain followed by peak extraction process to find the wake, the WTHT is used once more in this step. Finally, in the last step, the wake is overlapped on the original image. Experimental results on Tiangong-2 Interferometric Imaging Radar Altimeter (InIRA) images are presented and compared with that obtained by using the classical algorithm, and in this way, the better performance of our algorithm is demonstrated.   相似文献   

12.
基于卷积神经网络的遥感图像舰船目标检测   总被引:4,自引:1,他引:4  
针对遥感图像背景复杂、受环境因素影响大的问题,提出一种将卷积神经网络(CNN)与支持向量机(SVM)相结合的舰船目标检测方法,利用卷积神经网络可自主提取图像特征并进行学习的优点,避免了复杂的特征选择和提取过程,在复杂海况背景图像的处理中体现出较优的性能;同时,由于军舰样本获取难度大,应用迁移学习的概念,利用大量民船样本辅助军舰目标的检测,取得较好的效果。通过参数调整与实验验证,此方法在自行建立的测试集上检测率达到90.59%,对光照、环境等外界因素具有一定程度的鲁棒性。  相似文献   

13.
红外弱小目标的检测识别是军事侦察和遥感探测领域的一项关键技术。针对现有的传统目标检测方法普遍存在的检测误报率高、环境适应性差等问题,本文设计提出了一种基于Swin Transformer和多尺度特征融合的红外弱小目标检测方法。该方法首先在基于编解码Unet网络架构的基础上,通过引入Swin Transformer的自注意力机制代替常规的卷积核来进行目标特征的分层提取,从而有助于在更大的感受野下挖掘目标在不同尺度下的潜在信息;之后,通过设计一个自底向上的跨层特征融合模块作为网络模型的解码器,可以从复杂背景中保留红外弱小目标特征,并将目标的浅层局部信息和深层语义信息进行充分融合。试验测试结果表明,所提方法在红外小目标公共测试数据集SIRST上能够实现0.747的交并比指标(IoU),以及0.752的归一化交并比指标(nIoU),其性能均优于其它典型方法,在不同复杂场景下均拥有更好的检测效果。  相似文献   

14.
红外图像背景抑制可以为红外目标检测识别任务提供支撑。在实际的应用场景中,红外图像中的目标多为弱小目标,其特征不明显,一般背景抑制算法难以将其从背景中分离,而达不到背景抑制的最佳效果。针对上述问题,提出使用Pos-FCN网络实现红外图像背景抑制的方法,该方法使用特征卷积结构,依靠高分辨网络结构获取弱小目标的特征信息,通过大尺寸卷积特征图的前向传播方式实现了高维度特征中弱小目标信息的保留,使用卷积降采样特征提取和上采样图像恢复方式实现了端到端的处理,并在前置训练阶段引入了位置信息强化网络骨干特征提取效果。结果表明,该方法处理后的红外图像中信杂比提高至3.877,对比度提高至0.297,检测率达到了93.6%,因此,该方法可以实现良好的背景抑制效果。  相似文献   

15.
对物体的轮廓进行分析提取,是计算机视觉方向的基础问题之一,对其进行研究对于复杂场景的分析理解至关重要。本文对室内场景图像进行研究,基于图像特征进行图像分割,提取物体轮廓。在彩色场景图像全局轮廓后验边界概率(gPb)提取算法的基础上,加入深度图像信息,对室内场景的彩色、深度(RGB-D)图像中的物体轮廓进行分析。通过多尺度信息融合,计算得到多尺度轮廓后验概率(mPb)和谱后验概率(sPb),两后验概率加权综合得到gPb。而后结合超度量轮廓图与分水岭算法,对基于方向特征变化的gPb图像融合处理,最终得到清晰的物体轮廓。本文所提方法在通用的RGB-D数据库基础上进行实验。实验结果表明,本文所提出的方法能提取出清晰的室内物体轮廓图。   相似文献   

16.
复杂动态场景下目标检测与分割算法   总被引:1,自引:1,他引:0  
在动态场景等复杂条件下,往往难以对序列图像目标进行准确的检测与分割。根据序列图像中目标在复杂条件下的成像特点,提出了一种基于融合尺度不变特征变换(SIFT)流特征显著模型的动态场景目标检测与分割算法。通过对SIFT流算法表示运动特征信息的优势进行分析,并结合图像国际照明协会(CIE)Lab颜色空间的颜色和亮度特征信息,建立四维特征向量空间。利用改进的多尺度中心-环绕对比方法生成各特征通道的显著图并进行线性融合,建立序列图像的动态场景目标显著模型。最后利用均值漂移聚类算法和形态学处理实现对检测目标的精确分割。实验结果表明,相比传统检测与分割算法,该算法在动态背景与航拍等复杂场景下能够分割出更为完整的目标区域,具有良好的鲁棒性和高分割精度。   相似文献   

17.
针对现有红外和合成孔径雷达(Synthetic Aperture Radar,SAR)图像的融合算法融合质量差、边缘轮廓不清晰、效率低下、可视性差,目标检测效率低等问题,提出一种基于非下采样轮廓波变换的融合算法。首先采用非下采样轮廓波变换对预处理的红外和SAR图像进行分解,获得各自低频和带通方向图像,接着根据红外和SAR图像的特征选取其含重要目标信息的频带进行低频图像和带通方向图像融合。为了检验本文所提出算法性能的优越性,采用两组红外和SAR图像进行融合实验,与其他图像融合算法进行对比,并对融合图像进行目标检测,证明了该融合算法能有效提高多源图像目标检测率。  相似文献   

18.
基于跨尺度特征聚合网络的多尺度行人检测   总被引:1,自引:1,他引:0  
行人的空间尺度差异是影响行人检测性能的主要瓶颈之一。针对这一问题,提出了跨尺度特征聚合网络(TS-FAN)有效检测多尺度行人。首先,鉴于不同尺度空间呈现出的特征差异性,引入一种基于多路径区域建议网络(RPN)的尺度补偿策略,其在多尺度卷积特征层上自适应地生成一系列与其感受野大小相对应的候选目标尺度集。其次,考虑到不同层次卷积特征在视觉语义上的互补性,提出了跨尺度特征聚合网络模块,其通过横向连接、自上而下路径和由底向上路径,有效地聚合具有语义鲁棒性的高层特征和具有精确定位信息的低层特征,实现对卷积层特征的增强表示。最后,联合多路径RPN尺度补偿策略和跨尺度特征聚合网络模块,构建了一种尺度自适应感知的多尺度行人检测网络。实验结果表明,所提方法与当前一流的行人检测方法TLL-TFA相比,在整个Caltech公开测试数据集上(All:行人高度大于20像素)的行人漏检率降低到26.21%(提高了11.94%),尤其对于Caltech小尺寸行人子数据集上(Far:行人高度在20~30像素之间)的行人漏检率降低到47.30%(提高了12.79%),同时在尺度变化剧烈的ETH数据集上的效果也取得显著提升。   相似文献   

19.
基于分割途径的SAR单视图像斑点噪声抑制方法   总被引:5,自引:0,他引:5  
在图像分割思想的基础上,结合合成孔径雷达(SAR)图像的区域特征,利用恒虚警率边沿检测技术将分割区域最大化,并在分割区域内根据SAR图像特性进行优化滤波,得到了一种基于图像分割的单视SAR图像降斑方法.其中,边沿检测和区域分割在多视图像中进行,保证了检测和分割的有效性.计算机仿真结果证明了该方法的优越性.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号