首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 281 毫秒
1.
文本过滤中的特征抽取应用研究   总被引:1,自引:1,他引:0  
文本信息过滤技术需要解决的一个重要问题是对文档进行形式化处理,使得文本成为可计算和推理的信息。文中首先介绍了基于评估函数的文本特征抽取方法,分析评价了各种评估函数的优缺点,最后提出了一种利用特征抽取对文本信息进行过滤的方法,并说明如何使用评估函数对权重函数进行改进。  相似文献   

2.
在民航检修与维护过程中积累了大量蕴含丰富故障特征的文本维修记录,然而由于维修文本本身存在复杂性,其还未实现智能诊断,数据利用率低。提出一种不断修正迭代的基于预训练语言模型双向转换器编码表示(BERT)及轻量级梯度提升机(LightGBM)的飞机维修记录的故障原因分析方法,求解文本形式的维修记录中的故障原因,用以辅助维修人员进行正确的维修决策。首先,在基于BERT的故障诊断模型Transformer特征提取架构中引入多头注意力机制,以充分捕捉融合上下文的双向语义、更加关注于重点词汇;其次,为了提高诊断速度减少模型的参数并融合LightGBM模型来实现维修文本的故障原因分类;最后,将改进的模型与其他常用文本分析模型进行对比实验,在基于民机维修文本的故障诊断中该模型的准确率比TextCNN模型、LSTM模型和BiLSTM模型分别提升了38.99%、22.98%和18.16%,且BERT-LightGBM模型比BERT模型诊断速度提升了0.91%。表明所提方法在实现飞机维修文本故障诊断方面的有效性及优越性。  相似文献   

3.
设计并实现了面向内容安全的局域网监控系统。该系统包括网络数据内容还原和内容分析与过滤两大模块,采用旁听模式捕获网络数据包,利用协议分析和会话还原技术实现了应用数据还原;通过文本分析和过滤技术对还原后的应用数据进行安全性检验。该系统能够进行网络信息实时监控,有效地实现了局域网的信息内容监管。  相似文献   

4.
飞机飞行品质系统辨识是根据飞机系统的输入和输出响应时间历程求取该系统的数学模型及模型中的各参数的过程.本文给出一种在飞行试验中辨识飞机飞行品质短周期模态特性参数辨识试飞工程方法,首先应用连续域等效低阶系统传递函数来描述飞行品质模态特性系统,然后采用基于粒子群算法(Particle Swarm Optimization,PSO)的离散递推最小二乘算法,建立待估参数准则函数,通过极小化待估参数准则函数,求得参数的估计值,最后对辨识的模型进行验证.仿真算例表明该方法具有良好的收敛性和跟随性.  相似文献   

5.
专利分类中基于主题的特征权重计算方法   总被引:1,自引:1,他引:0  
专利自动分类是一个大规模、多层次结构的复杂文本分类问题.其中特征权重计算是一个关键环节,关系到专利的文本表示能否体现出主题信息的问题.本文通过分析专利(标题和摘要)的特点,提出了一种基于主题的特征权重计算新方法.该方法通过考察特征与主题的相关性来确定权重,使专利的文本表示更趋近于文章的主题.实验结果表明,该方法优于一般的权重计算方法,取得了较好的效果.  相似文献   

6.
人在回路电视制导武器最佳投射域建模与仿真   总被引:1,自引:0,他引:1  
丁达理  任波  黄长强  张得舒 《航空学报》2010,31(5):1054-1059
为提高人在回路电视制导武器命中精度,必须选择合适的武器投射域。分析了影响武器投射域的主要因素和约束条件,建立了人在回路控制的电视制导武器防区外投射的数学模型。根据该模型,提出了一种基于图论的防区外武器最佳投射域算法,并对算法进行了仿真分析。仿真结果表明:该算法能够根据武器制导的约束条件找到满足武器投射的最佳投射域,该模型的建立和最佳投射域算法的提出为该类型电视制导武器的作战使用自动规划提供了依据和参考。  相似文献   

7.
针对传统的文本分类模型存在特征提取能力不足和分类准确率较低等问题,提出一种基于卷积神经网络和双向门控循环单元相结合(CNN-BiGRU)的文本分类方法。首先,以图书情报领域相关主题文本摘要为数据源,通过Word2vec进行文本向量化;其次,通过CNN获得输入文本信息的局部特征,并使用BiGRU保留文本中的顺序相关性;然后,选择softmax分类器输出分类结果;最后,与传统的机器学习分类方法和单一的深度神经网络模型分类方法进行对比实验。结果表明,在数据量大的情况下,文中提出的CNN-BiGRU分类模型具有更好的分类效果,其准确率、召回率和F1值均达到了95%以上,能够在一定程度上解决学术文本“信息过载”等问题。  相似文献   

8.
OpenGL库没有提供直接的文本显示和处理函数,文献[4]给出一种基于GDI的OpenGL文本绘制方法,但该方法效率低,CPU占用量大。考虑到Windows多线程机制,对上述方法做出改进,提出了一种基于多线程的OpenGL文本绘制方法。该方法可有效利用多核处理器的优势,在对实时性要求较高或进行大批量文本数据绘制等方面有明显优势。实验结果表明,使用此方法能够有效提高文本绘制效率,改善用户体验。  相似文献   

9.
空中交通管制危险源特征提取是针对空中交通危险源记录的关键信息检索任务。基于文本特征的提取方法仅依据统计结果来对术语的重要性进行排序。通过引入专家知识来提取符合危险源定义的特征,提出了一种基于专家知识的特征提取方法来定义危险源特征并构建危险源分析框架。算法通过迭代对专家知识进行提炼和积累。实验结果表明,基于专家知识的特定语言处理后得到的数据集可以提取更多信息量的候选特征,以便通过k-means算法构建危险源记录的分析语境。该特征提取模型比其他四种算法获得了更高的精度,在空中交通管制运行数据集和通导数据集中分别达到82%和86%。此外,信息丰富的危险特征为安全管理部门的决策提供了支持,降低了隐患排查的成本。  相似文献   

10.
基于Windows SPI技术,采用VSM模型计算网页间的相似度,提出了一种网页过滤系统.该系统可以根据http请求地址和网页内容实现网页过滤,并采用基于用户反馈的自学习模型,可以不断的学习提高,实验表明该系统能有效的实现网页过滤.  相似文献   

11.
精读教材每单元的课文都是一个大的篇章,完整的意义单位。无论其题材和体裁如何千变万化,作者的谋篇布局都是围绕着主题进行的。帮助学生建构起文章的宏观结构有助于他们把握文章的内容和形式。考察文章的微观结构,也就是句子内部及句际间的逻辑语义关系,可使学生了解上下文之间的内在联系,在繁复的信息中分清主次,并且注意到语境对意义的限定,对阅读者思维指向的约束和引导。语篇中各语言要素的相互关系还体现在语言的表层结构中。形式和内容的统一是语言交际目的达成的基础。  相似文献   

12.
针对已有文本水印嵌入算法中所采用的二进制数据流描述文本水印时所表达的信息有限、水印容量较小的问题,提出了一种基于文本编码分割的医学影像文本水印算法,通过二维离散小波变换对医学影像的不同层次进行分解,将编码分割处理后的文本水印嵌入到小波分解的三级低频部分,实现了文本水印的隐秘嵌入。实验结果表明,该算法可提高医学影像文本水印容量2-3倍。  相似文献   

13.
在计量工作中,需要对大量的文档、数据进行管理.在寻找相关资料时,依靠人工方式或者简单的搜索方式,搜索效率低,不易管理.本文首先分析了这一情况,然后提出了一种基于Lucene的构建全文检索的方案,简要介绍了实现原理,并通过一个实例说明了实现方法,最后和现有的相关搜索方案进行了对比.实现全文检索后,可以有效的提高搜索效率,方便计量工作的进行.  相似文献   

14.
鉴于飞机起降的安全考虑,机场需要配备助航灯来保证机场所需要的能见度,因此机场助航灯调光系统已经有很多研究者开发过.此处的调光系统是一种利用自己开发的控制模块和CAN总线相结合而设计的系统.首先介绍了机场助航灯恒流调光系统的整体硬件结构框图和各部分的硬件框图,对硬件部分作了简要的介绍;接着重点对该系统的核心部分进行了软件方面的介绍,给出了软件流程图.  相似文献   

15.
语篇连贯既是一种语言现象,又可以被看作是一种心理行为。看一个语篇是否连贯是离不开依据语篇的呈现方式进行的逻辑推理以及世界知识的记忆和调取等心理活动。连贯在很大程度上是来自于理解者在对语篇加工时所产生的推导过程。以回指推理以及主题推理为例,通过对语篇推理过程的论述具体说明了阅读者是怎样通过推理过程在自己的认知中做出语篇是否连贯的判断的,从而促进阅读者更好地理解语篇的连贯。  相似文献   

16.
机载机电系统综合控制管理(简称公管系统)是机载机电设备发展的必然趋势,为了研究公管系统对机电子系统的控制、管理功能,需要对子系统进行建模仿真。本文针对某型飞机环控温度控制系统工作过程对环控温度控制系统关键附件进行了数学建模,同时针对某课题研究内容的需要,研究如何采用半物理仿真的方法对飞机环控温度控制系统进行系统建模和环境仿真并进行了系统仿真验证试验,最后给出结论。  相似文献   

17.
传统的文本聚类算法存在文本向量维度过高,算法易陷入局部最优问题。针对上述问题,提出了一种适用于文本的基于潜在语义索引的谱聚类方法,该方法应用了潜在语义索引和谱聚类方法的优点。不仅分析了词与词之间的语义关系,而且适用于任意形状分布的样拳数据聚类。针对航空安全报告的聚类实验表明,该方法取得了较好的聚类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号