首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
基于卷积神经网络的遥感图像舰船目标检测   总被引:4,自引:1,他引:4  
针对遥感图像背景复杂、受环境因素影响大的问题,提出一种将卷积神经网络(CNN)与支持向量机(SVM)相结合的舰船目标检测方法,利用卷积神经网络可自主提取图像特征并进行学习的优点,避免了复杂的特征选择和提取过程,在复杂海况背景图像的处理中体现出较优的性能;同时,由于军舰样本获取难度大,应用迁移学习的概念,利用大量民船样本辅助军舰目标的检测,取得较好的效果。通过参数调整与实验验证,此方法在自行建立的测试集上检测率达到90.59%,对光照、环境等外界因素具有一定程度的鲁棒性。  相似文献   

2.
物流、保险和中介服务等行业需要频繁地拨打电话,而人工拨打电话效率较低,高效的电话号码识别技术具有重要的应用价值。传统的印刷体数字识别方法存在人工设计特征过程复杂、识别字体单一等不足,难以满足实际应用需求。本文提出了一种基于深度学习的交互式的电话号码识别方法,通过鼠标双击图像中的电话号码,自动截取出包含此号码的目标区域,并进行灰度化、二值化、目标区域定位、字符分割和图片补白等预处理操作,在此基础上利用改进的LeNet-5卷积神经网络(CNN)自动学习图像特征,支持多种字体、字形和字号的印刷体数字识别,并利用交互式识别和内存池等方法提高识别速度。实验结果表明,单一字符的识别率为99.86%,整个号码的识别率为99.50%,整个号码平均识别时间为91 ms。本文方法识别精度高、识别速度快,具有较为广泛的应用前景。   相似文献   

3.
图像定位常用于无人机视觉导航,传统的无人机视觉导航广泛采用景象匹配导航方式,随着计算机技术的不断发展,深度学习技术为视觉导航的实现提供了新途径。以无人机的垂直侦查为背景,将飞行区域的航拍图像划分成大小相同的若干网格,每个网格代表一类区域,用网格图像制作数据集训练卷积神经网络(CNN)。基于AlexNet设计了一种融合显著性特征的全卷积网络模型,有效实现了一个基于CNN的多尺寸输入的滑动窗口分类器,并提出了一种邻域显著性参照定位策略来筛选分类结果,从而实现多尺寸航拍图像的定位。   相似文献   

4.
针对中医舌诊中舌体分割不准确、分割速度较慢且需要人工标定候选区域等问题,提出了一种端到端的舌图像分割算法。与传统舌图像分割算法相比,所提算法可以得到更为准确的分割结果,并且不需要人工操作。首先,使用孔卷积算法,可以在不增加参数的条件下扩大网络的特征图谱。其次,使用孔卷积空间金字塔池化(ASPP)模块,令网络通过不同的感受野学习舌图像的多尺度特征。最后,将深度卷积神经网络(DCNN)和全连接的条件随机场(CRF)相结合,细化分割后的舌体边缘。实验结果表明:所提算法优于传统舌图像分割算法和主流的深度卷积神经网络,具有较高的分割精度,平均交并比达到了95.41%。   相似文献   

5.
一种基于自动特征学习的陨石坑区域检测算法   总被引:1,自引:1,他引:0  
基于陨石坑的视觉导航技术成为一种新颖的高精度空间探测自主导航方式,如何从导航图像中精确地提取陨石坑区域是实现基于陨石坑视觉导航的首要条件。针对这一问题,根据陨石坑导航图像特点,提出了一种基于自动特征学习的陨石坑区域检测算法。首先,基于最大稳定极值区域检测算法提取陨石坑候选区域;其次,利用卷积神经网络(CNN)自动学习提取候选区域的特征;最后,通过支持向量机(SVM)实现候选区域的精确分类,得到真实的陨石坑区域。大量的仿真实验表明:与传统的基于人工特征的陨石坑区域检测算法相比,提出的基于自动特征学习的陨石坑区域检测算法具有更高的检测精度和更好的鲁棒性,在通用火星表面陨石坑数据集上,所提算法的F1度量指标较于传统算法高出8%,可以广泛地应用于基于陨石坑的视觉导航算法中的陨石坑区域提取,为基于陨石坑视觉导航算法提供精确的导航路标输入。   相似文献   

6.
    
随着手势动作识别技术在人机交互、生活娱乐及医疗服务等应用领域的逐步深入,其对非接触、微光条件下的稳健测量与识别能力提出更高要求。针对该问题,研究了一种基于线性调频连续波(LFMCW)雷达距离-多普勒(RD)信息和卷积神经网络(CNN)的典型手势动作识别方法。首先,对于LFMCW雷达回波,通过去斜、快时间域快速傅里叶变换和相干积累,获取手势目标的二维RD像数据;其次,以RD像幅度矩阵作为CNN输入样本,利用2层卷积与池化处理构建特征空间,从而通过全连接与softmax分类器实现对手势动作的有效识别;最后,在此基础上,采用24 GHz工业雷达传感器设计手势测量实验系统,形成关于4种典型手势动作的LFMCW雷达回波数据库。实验结果表明,将24 GHz LFMCW雷达回波RD处理与CNN结合能够实现对典型手势动作的有效识别。  相似文献   

7.
针对特征词袋(BoF)模型缺乏空间和几何信息,对纹理图像内容表达不明显等问题,提出一种基于BoF模型的多特征融合纹理分类算法。将灰度梯度共生矩阵(GGCM)和尺度不变特征转换(SIFT)融合特征作为纹理图像的区域特征描述,通过动态权重鉴别能量分析进行最优参数特征选择,并用BoF量化纹理特征,使用支持向量机对图像进行训练和预测,得出分类结果。实验结果表明,本文算法对有旋转扭曲的纹理、边缘模糊纹理、有光照变化的纹理及杂乱纹理等均能取得较好的分类效果,相对于传统BoF模型及凹凸划分(CCP)方法等算法在UIUC纹理库上的分类正确率均有不同程度的提高,平均分类正确率分别提高12.8%和7.9%,说明本文算法针对纹理图像分类具有较高的精度和较好的鲁棒性。   相似文献   

8.
近年来,卷积神经网络(CNN)已被计算机视觉任务广泛采用。由于FPGA的高性能、能效和可重新配置性,已被认为是最有前途的CNN硬件加速器,但是受FPGA计算能力、存储资源的限制,基于传统Winograd算法计算三维卷积的FPGA解决方案性能还有提升的空间。首先,研究了适用于三维运算的Winograd算法一维展开过程;然后,通过增加一次性输入特征图和卷积块的维度大小、低比特量化权重和输入数据等方法改善CNN在FPGA上的运行性能。优化思路包括使用移位代替部分除法的方法、分tile方案、二维到三维扩展及低比特量化等4个部分。相对传统的二维Winograd算法,优化算法每个卷积层的时钟周期数减少了7倍左右,相较传统滑窗卷积算法平均每个卷积层减少7倍左右。通过研究,证明了基于一维展开的3D-Winograd算法可以大大减少运算复杂度,并改善在FPGA运行CNN的性能。   相似文献   

9.
卷积神经网络(CNN)在视频增强方向取得了巨大的成功。现有的视频增强方法主要在空域探索图像内像素的相关性,忽略了连续帧之间的时域相似性。针对上述问题,提出一种基于时空域上下文学习的多帧质量增强方法(STMVE),即利用当前帧以及相邻多帧图像共同增强当前帧的质量。首先根据时域多帧图像直接预测得到当前帧的预测帧,然后利用预测帧对当前帧进行增强。其中,预测帧通过自适应可分离的卷积神经网络(ASCNN)得到;在后续增强中,设计了一种多帧卷积神经网络(MFCNN),利用早期融合架构来挖掘当前帧及其预测帧的时空域相关性,最终得到增强的当前帧。实验结果表明,所提出的STMVE方法在量化参数值37、32、27、22上,相对于H.265/HEVC,分别获得0.47、0.43、0.38、0.28 dB的性能增益;与多帧质量增强(MFQE)方法相比,平均获得0.17 dB的增益。   相似文献   

10.
无人机数据链通信受到各种自然与人为的干扰,信噪比(SNR)是信道状态和通信质量的有效评估指标。为解决传统估计算法信噪比估计精度不足的问题,提出了一种卷积神经网络(CNN)与长短时记忆(LSTM)网络结合的估计模型。利用仿真与实测相结合的方式,构建了一个包含不同信噪比、调制方式、衰落信道等信息的无人机通信信号数据集;在网络训练阶段,将样本序列进行分割,对分割后的每一部分序列使用CNN-LSTM网络提取深度特征,多次训练并保存模型参数;在测试阶段,利用构建好的测试集完成对算法的验证与测试,得到信噪比估计值。实验表明,相比于传统信噪比估计算法与单一网络结构的深度学习算法,所提算法的均方误差最低,实现了对信噪比的高精度估计。   相似文献   

11.
机场道面裂缝、角隅断裂、接缝破碎、修补等病害宽度狭小、长短不一、图像中像素占比少,呈细带状结构,且与复杂背景对比度低,现有检测算法效果不佳。针对以上问题,提出了一种基于注意力机制与特征融合的深度神经网络模型DetMSPNet。首先,利用注意力机制模块CBAM,使得特征学习更加专注于细带状结构病害区域,抑制干扰信息;其次,构建残差空洞金字塔模块,提取不同尺度空间下的特征信息;然后,设计最大池化支路,便于之后浅、深层不同层次特征进行融合,加强模型对于病害的定位能力,并且将深层特征输入3种不同扩张率的扩张卷积和金字塔池化模块,使得病害特征包含更多全局上下文信息;最后,对所有层输出的病害特征信息进行融合,实现不同尺度、不同层次特征的信息互补。与目前3种经典的目标检测算法在机场道面病害图像数据集APD上做了对比实验,结果表明:所提算法的mAP达到78.51%,优于对比算法。所提DetMSPNet模型,提高了算法对机场道面细带状结构病害检测中宽度狭小、长短不一、图像中像素占比少、与复杂背景对比度低等情况的适应能力。   相似文献   

12.
随着城市智能化的发展, 基于WiFi接收信号强度(RSS)的指纹室内定位服务受到社会的广泛关注。深度学习技术是利用RSS信号获得高室内定位性能的一种重要手段, 但其易遭受对抗样本攻击, 给定位系统带来严重安全隐患。为此, 提出了一种抵御对抗样本攻击的基于深度学习的RSS指纹室内定位方法(AdvILoc)。该方法基于图像识别领域对抗样本防御方法的研究和分析, 结合室内RSS指纹数据特征单一且高维的特点, 通过在RSS指纹室内定位深度学习模型中添加池化层、全连接层, 以及满足差分隐私的噪声层来抵御对抗样本攻击, 解决了基于深度学习的室内定位模型易过拟合且泛化能力不高的问题。通过添加Dropout层, 以及设计模型参数正则化方法, 提高模型抵御对抗样本攻击的鲁棒性。在2个真实RSS指纹室内定位数据集上的实验结果表明:与已有基于多层感知机(MLP)、卷积神经网络(CNN)的RSS指纹室内定位方法相比, 所提方法在保证时间开销和基本不影响定位模型性能的情况下, 提高了模型抵御对抗样本攻击的鲁棒性;在满足l2范式规范的C&W攻击下, 随着攻击大小不断增大, 模型的定位准确率下降也更平稳。   相似文献   

13.
为了提高视频卫星对运动车辆的检测质量,在经典视觉背景提取器(ViBE)算法的基础上,结合遥感的面向对象分类技术,从提升正确检测运动目标数量和抑制虚假运动目标检测数量两个方面着手,提出了一种新的运动车辆检测方法(VOMVD)。首先通过优化ViBE模型参数,尽可能多地获取真实运动目标,但这在一定程度引入了许多的虚假目标。研究继而依据影像上地面小尺度运动目标和道路的依存关系,采用面向对象的分类方法,基于光谱、纹理、空间属性,构建了均值、标准差、卷积核内平均灰度值、卷积核内平均信息熵、面积、长度、紧密度、延伸度等8个特征,用于提取道路信息,以此掩膜ViBE提取的虚假运动目标和伪运动目标。结果表明,基于本研究提出的视频卫星运动目标检测方法较之三帧差分法、ViBE检测方法等,其精度有明显提升。在本研究中,三帧差分法、ViBE和VOMVD对运动目标的检测精度P分别为70.91%,61.49%和85.71%,召回率R分别为84.78%,98.91%和97.83%,F值分别为77.23%,75.83%和91.37%,有效提升了方法对运动目标的检测效果。  相似文献   

14.
针对卫星云图中的灾害天气数据存在严重不平衡问题,提出一个结合生成对抗学习(GAN)和迁移学习(TL)的卷积神经网络(CNN)框架以解决上述问题进而提高基于卫星云图的灾害天气分类精度。该框架主要包含基于GAN的数据均衡化模块和基于迁移学习的CNN分类模块。上述2个模块分别从数据和算法层面解决数据的类间不平衡问题,分别得到一个相对均衡的数据集和一个可在不同类别数据上提取相对均衡特征的分类模型,最终实现对卫星云图的分类,提高其中灾害天气的卫星云图类别分类准确率。与此同时所提方法在自建的大规模卫星云图数据上进行了测试,消融性和综合实验结果证明了所提数据均衡方法和迁移学习方法是有效的,且所提框架模型对各个灾害天气类别的分类精度都有显著提升。   相似文献   

15.
为了更加准确地进行异源遥感图像的变化检测任务,提出了一种基于混合网络的异源遥感图像变化检测算法。利用伪孪生网络提取异源遥感图像块间空间维度的变化特征,利用早期融合网络提取异源遥感图像块间光谱维度的变化特征,将2支网络提取的特征进行融合,并将融合后的变化特征输入到sigmoid层进行二分类检测。同时,在伪孪生网络中加入对比损失函数,通过优化对比损失函数,使得在特征空间中,未变化图像对的空间特征差异更小,变化图像对的空间特征差异更大,以提升网络的区分能力和收敛速度。   相似文献   

16.
基于光学图像的撞击坑识别研究综述   总被引:1,自引:0,他引:1  
当前,随着深空探测研究工作的需要,将信息科学的图像处理、模式识别技术应用到空间探测领域成为必然。基于光学图像的撞击坑自主检测技术就是将信息科学的图像处理技术应用到空间科学研究中的一个很好例证,近年来得到了各国学者的重视。本文针对这一领域的相关研究进行了介绍与分析。首先,对这一技术的研究意义从地质学、天体表面结构和特征数据库建设、探测器导航三个角度加以说明;其次,详细阐述了该技术的研究现状,简要介绍了其中一些经典算法,并将相关算法分为三类:全自主检测算法、半自主检测算法和组合检测算法;最后,提出了该技术研究所面临的难点和未来研究方向与应用空间,以及介绍了作者在这一方面的研究进展。  相似文献   

17.
In recent years, deep learning (DL) methods have proven their efficiency for various computer vision (CV) tasks such as image classification, natural language processing, and object detection. However, training a DL model is expensive in terms of both complexities of the network structure and the amount of labeled data needed. In addition, the imbalance among available labeled data for different classes of interest may also adversely affect the model accuracy. This paper addresses these issues using a new convolutional neural network (CNN) based architecture. The proposed network incorporates both spatial and spectral information that combines two sub-networks: spatial-CNN and spectral-CNN. The spectral-CNN extracts spectral information, while spatial-CNN captures spatial information. Moreover, to make the features more robust, a multiscale spatial CNN architecture is introduced using different kernels. The final feature vector is formed by concatenating the outputs obtained from both spatial-CNN and spectral-CNN. To address the data imbalance problem, a generative adversarial network (GAN) was used to generate data for the underrepresented class. Finally, relatively a shallower network architecture was used to reduce the number of parameters in the network and improve the processing speed. The proposed model was trained and tested on Senitel-2 images for the classification of the debris-covered glacier. The results showed that the proposed method is well-suited for mapping and monitoring debris-covered glaciers at a large scale with high classification accuracy. In addition, we compared the proposed method with conventional machine learning approaches, support vector machine (SVM), random forest (RF) and multilayer perceptron (MLP).  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号