排序方式: 共有142条查询结果,搜索用时 359 毫秒
91.
无人机已经被广泛应用到各个领域,目标检测成为无人机视觉领域关键技术之一。针对无人机图像中场景复杂、尺度多变、小目标丰富等问题,提出了一种基于多尺度深度学习的自适应航拍目标检测算法。首先,构建自适应特征提取网络MSDarkNet-53,引入多尺度卷积方式,采用不同类型卷积核对不同尺寸目标进行运算,有效扩大感受野。其次,结合注意力机制的优点设计卷积模块,自适应优化特征权重,增强有效特征,抑制无效特征,得到表征能力更强的特征。最后,构建基于多尺度特征融合的预测网络,根据小目标的特点,选取多层级特征映射融合成高分辨率特征图,在单一尺度上进行目标分类和边界框回归。实验表明:本文算法提升了无人机图像的目标检测精度,具有良好的鲁棒性。 相似文献
92.
针对高分辨率遥感影像中道路形状结构错综复杂,出现窄小型道路提取错误或漏分的问题,提出一种基于空洞空间金字塔池化和注意力机制的轻量化遥感影像道路提取方法。首先,在原始高分辨率网络(HRNet)基础上,通过引入空洞空间金字塔池化模块,实现多尺度道路信息融合;再引入挤压激励通道注意力机制,增强网络特征表征质量;最后使用深度可分离卷积方法改进网络残差模块实现模型轻量化,以降低模型计算复杂度。在公开数据集上进行了模型性能测试,实验结果表明,文章所提算法的准确率、精确率、召回率、F1分数和平均交并比,相比原始HRNet分别提升了5.35%、2.15%、4.1%、3.15%和14.34%,且减少了36.1%的参数数量;相比其他网络,该算法突出了细小道路的特征,道路预测结果连续性、完整性好,并且模型小易于部署在实时检测设备中,有效改善了道路提取任务中错分和缺失的情况,是一种适应性更强、分割精度更高、更轻量化的多尺度道路提取算法。 相似文献
93.
行人重识别技术是智能安防系统中的重要方法之一,为构建一个适用各种复杂场景的行人重识别模型,基于现有的卷积神经网络和Transformer模型,提出一种融合卷积注意力和Transformer(FCAT)架构的方法,以增强Transformer对局部细节信息的关注。所提方法主要将卷积空间注意力和通道注意力嵌入Transformer架构中,分别加强对图像中重要区域的关注和对重要通道特征的关注,以进一步提高Transformer架构对局部细节特征的提取能力。在3个公开行人重识别数据集上的对比消融实验证明,所提方法在非遮挡数据集上取得了与现有方法相当的结果,在遮挡数据集上的性能得到显著提升。所提方法更加轻量化,在不增加额外计算量和模型参数的情况下,推理速度得到了提升。 相似文献
94.
点云被广泛地用于三维物体表达,不过真实世界采集到的点云往往数据庞大,不利于传输与储存,针对点云数据冗余性问题,引入基于注意力机制的Transformer模块,提出一种基于Transformer的端到端多尺度点云几何压缩方法。将点云进行体素化,在编码端利用稀疏卷积提取特征,进行多尺度的逐步下采样,结合Transformer模块加强点空间特征感知与提取;在解码端进行对应的多尺度上采样重建,同样采用Transformer模块对有用特征进行加强与恢复,逐步细化并重建点云。与2种点云标准编码方法对比,所提方法平均获得80%和75%的BD-Rate增益;与基于深度学习的点云压缩方法对比,平均获得16%的BD-Rate增益,在相同码率点有约0.6的PSNR提升。实验结果表明:Transformer在点云压缩领域的可行性与有效性;在主观质量方面,所提方法也有明显的主观效果提升,重建的点云更接近原始点云。 相似文献
95.
高校学报编辑消极心理现象成因分析及其调适 总被引:1,自引:0,他引:1
基于高校学报有着与一般的杂志、期刊显著的不同,高校学报的编辑人员在工作过程中形成了独特的心理特征,而其中的消极心理如果长期得不到调适就会影响到他们日常的工作、学习、生活和身心健康发展。文章对其中的几种常见消极心理现象及其成因进行简要的分析,并提出了相应的调适方法:牢固树立正确的编辑价值观和编辑职业精神;完善个性心理品质;自觉调整情绪状态,创造恬静愉悦的心理环境;合理安排工作,将注意力转移;改善编辑办公条件,提高编辑人员待遇。 相似文献
96.
针对烟雾因半透明、形状不规则和边界模糊造成分割困难的问题,提出了基于注意力机制的长距离信息建模方法,以提取长距离像素间的依赖和连续性关系。通过注意力机制作用原理,解决孤立小块区域误分类问题,减少非连续区域的烟雾误判。为避免注意力网络大尺寸矩阵运算造成的内存和计算负担,对空间和通道2种注意力方式进行改进,分别设计了双向定位空间注意力(BDA)模块和多尺度通道注意力(MSCA)融合模块,弥补现有注意力全局池化操作导致的大量空间信息丢失。将所提注意力模块和残差深度网络合并,构建面向图像烟雾分割的全局烟雾注意网络,在尽可能不丢失全局信息相关性的同时减少内存消耗。实验结果表明:所提网络在DS01、DS02、DS03合成烟雾测试集上,取得的平均交并比分别为73.13%、73.81%、74.25%,总体上优于对比算法。 相似文献
97.
新冠肺炎疫情持续蔓延给人类社会带来深远影响,准确预测各地区的病毒传播趋势对防控疫情而言至关重要。现有研究主要基于传统的时序预测模型和传染病模型,鲜有考虑疫情地区关联复杂和时序依赖性强的特点,限制了其疫情预测的性能。为此,针对新冠肺炎疫情的预测任务,提出了一种时空注意力驱动的自编码器框架。通过引入空间注意力机制捕捉病毒感染序列间的动态空间关联性,利用时间注意力机制挖掘病毒感染序列中复杂的时序依赖性,以此实现对不同地区的新冠肺炎病毒传播趋势的准确预测。在模型的编码器端,融合空间注意力机制的长短期记忆(LSTM)网络,关联目标地区与其他地区的病毒感染序列,提取该区域近期新冠肺炎疫情的时序特征。在模型的解码器端,将时间注意力机制引入基于LSTM网络的解码器中,通过捕捉病毒感染序列的时序依赖性推测未来的新冠肺炎疫情趋势变化。在多个公开的新冠肺炎疫情数据集上对所提模型进行验证,实验结果表明:所提模型的预测性能超越了LSTM等模型;在公开的欧洲部分国家新冠肺炎疫情数据集上,预测误差指标RMSE和MAE分别降低了22.3%和25.0%,在中国部分省级单位新冠肺炎疫情数据集上,RMSE和MAE分别降低了... 相似文献
98.
基于天顶对流层延迟(ZTD)的强时空特征,提出了一种融合卷积神经网络的改进注意力机制(CNN-ATT)的多站点ZTD组合预测模型。该模型首次将多源数据(包括日解算精度、年积日(DOY) 和三维坐标)综合运用于ZTD预测任务。通过对南宁市的5个参考站(CORS)和14个国际GNSS服务(IGS)站点共1 501个年积日的观测数据进行研究,选取传统BP模型、GPT2w模型和ATT模型作为基线模型进行实验对比分析。研究结果显示,在预测精度方面,改进的CNN-ATT模型与BP模型相比其均方误差(MSE)和平均绝对误差(MAE)分别减少了5.5 mm和 4.4 mm,预测精度分别提高了41.4%和67.8%;与ATT模型相比,CNN-ATT模型的预测MSE和MAE也分别减少了4.6 mm和2.1 mm,预测精度分别提升了36.2%和50.0%。在定位精度方面,改进的CNN-ATT模型的精度表现优于SAAS,GPT2w,BP以及ATT模型。并且与传统SAAS对流层模型相比,CNN-ATT模型在N,E,U 3个方向的精度提升高达18.2%,12.6%和31.0%。此外,研究还发现CNN-ATT模型在长预测时间步长中的精度表现更为稳定,更适合多测站预测任务,并且其精密单点定位(PPP)收敛速度更快。 相似文献
99.
现有图像描述文本生成模型能够应用词性序列和句法树使生成的文本更符合语法规则,但文本多为简单句,在语言模型促进深度学习模型的可解释性方面研究甚少。将依存句法信息融合到深度学习模型以监督图像描述文本生成的同时,可使深度学习模型更具可解释性。图像结构注意力机制基于依存句法和图像视觉信息,用于计算图像区域间关系并得到图像区域关系特征;融合图像区域关系特征和图像区域特征,与文本词向量通过长短期记忆网络(LSTM),用于生成图像描述文本。在测试阶段,通过测试图像与训练图像集的内容关键词,计算2幅图像的内容重合度,间接提取与测试图像对应的依存句法模板;模型基于依存句法模板,生成多样的图像描述文本。实验结果验证了模型在改善图像描述文本多样性和句法复杂度方面的能力,表明模型中的依存句法信息增强了深度学习模型的可解释性。 相似文献
100.
航空发动机性能退化趋势复杂,适时地对其进行剩余寿命预测和检修维护十分重要。提出一种基于多特征注意力的膨胀卷积网络模型来预测航空发动机剩余使用寿命,利用膨胀卷积增强提取序列数据时序信息的能力,同时建立残差连接以改善传统卷积网络中的梯度消失问题。首先采用定长滑动时间窗沿时间维度截取数据,对数据进行重构;再对每个特征对应的时间序列单独应用膨胀卷积提取时序信息;引入特征注意力机制计算各特征之间的相对重要性;在公开的航空发动机数据集上进行验证,并对比现有的主流预测方法。结果表明:该模型在时间序列数据预测方面有着更高的精度。 相似文献