首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 265 毫秒
1.
针对传统的文本分类模型存在特征提取能力不足和分类准确率较低等问题,提出一种基于卷积神经网络和双向门控循环单元相结合(CNN-BiGRU)的文本分类方法。首先,以图书情报领域相关主题文本摘要为数据源,通过Word2vec进行文本向量化;其次,通过CNN获得输入文本信息的局部特征,并使用BiGRU保留文本中的顺序相关性;然后,选择softmax分类器输出分类结果;最后,与传统的机器学习分类方法和单一的深度神经网络模型分类方法进行对比实验。结果表明,在数据量大的情况下,文中提出的CNN-BiGRU分类模型具有更好的分类效果,其准确率、召回率和F1值均达到了95%以上,能够在一定程度上解决学术文本“信息过载”等问题。  相似文献   

2.
文本过滤中的特征抽取应用研究   总被引:1,自引:1,他引:0  
文本信息过滤技术需要解决的一个重要问题是对文档进行形式化处理,使得文本成为可计算和推理的信息。文中首先介绍了基于评估函数的文本特征抽取方法,分析评价了各种评估函数的优缺点,最后提出了一种利用特征抽取对文本信息进行过滤的方法,并说明如何使用评估函数对权重函数进行改进。  相似文献   

3.
针对需要识别海量试飞运营问题中的故障问题用于可靠性指标计算评估,基于深度学习中的文本卷积神经网络,提出一种试飞运营问题文本分类方法。通过收集大量的以人工分类的试飞运营问题文本作为实验数据集,并进行相应的预处理,运用Word2Vec模型将问题描述文本训练成词向量,构建出TextCNN模型进行训练完成问题文本的分类。最后通过实验表明,基于TextCNN模型的试飞运营问题分类方法可以为试飞运营问题自动化分类工作提供参考。  相似文献   

4.
专利文献是一种具有法律效力的科技文献,其内容覆盖了几乎所有的技术领域的最新、最活跃的创新技术信息,因此对专利文献的分类和组织在专利管理中有着重要意义。本文通过对现有的专利自动分类技术的归纳和分析,融合BM25相似度计算方法和样本邻域信息提出一种基于共享最近邻的KNN专利自动分类方法。本方法的有效性在NTCIR-8专利分类评测任务中得到充分验证。  相似文献   

5.
树形结构SVMs多类分类的研究   总被引:2,自引:0,他引:2  
介绍了SVM方法原理,为了将SVM在解决两类分类问题中的优越性推广至解决多类分类问题,分析构建树方法与SVM结合运用来提高SVM在进行多类分类时的训练效率的方法, 然后构造文本自动分类,实验说明该方法有较高的训练效率,并且所需的训练样本量大大降低。  相似文献   

6.
基于语义信息的问题分类   总被引:1,自引:0,他引:1  
问题分类是问答系统的一个非常基础而重要的子模块。以问题的语义信息为分类依据,建立了一个新的问题分类体系,并提出了一种基于《知网》的自动分类方法。利用该方法对507个问题进行分类实验。实验中问题分类的平均召回率为93.72%,平均正确率为82.23%。实验结果表明,该分类方法是有效的并且以语义信息作为分类依据是可行的。  相似文献   

7.
基于空间多特征综合推理的航迹航路关联   总被引:1,自引:0,他引:1  
梁彦  王晓华  李立  张金凤  史志远  杨峰 《航空学报》2016,37(5):1595-1602
针对航迹分类问题,研究了基于空间多特征的综合推理在航路判读中的应用。首先根据空管系统对航路以及飞机飞行的要求,对航迹航路相关问题进行建模。然后根据已知的传感器系统输出的目标特性(位置,航向)与已知的多个航路信息分别进行相关度计算,构造基本信任函数,通过对其融合,得到目标单特征识别结果。其中,通过合理地引入复合类,实现了对目标类别的广义信任分类。建立了多特征折扣融合算法,对多特征基本信任函数进行折扣后再融合,得到目标多特征识别结果。仿真结果以及空管实际数据测试表明:该算法不仅可以实现航迹分类,同时可以有效地降低分类的错误率。  相似文献   

8.
基于模板的机器翻译方法在专利文本的自动翻译中具有广泛的应用。由于专利文本具有形式规范,语言严谨,结构性强的特点,本文提出一种面向英文专利文本的单语模板的自动获取方法,这种方法首先通过分析专利文本结构并对其进行分类,然后对句子进行组块分析并分析句型,最后确定出模板的固定部分和可泛化部分进而对专利文本进行模板的自动抽取。实验结果证明了这种方法在专利文本的模板的自动获取上具有很好的性能。  相似文献   

9.
基于IRCMNDE和NNCHC的滚动轴承故障诊断   总被引:1,自引:1,他引:0  
针对多尺度散布熵(MDE)在粗粒化过程中易发生信息丢失、产生虚假信息,难以全面提取轴承故障信息的问题,提出了基于改进的精细复合多尺度归一化散布熵(IRCMNDE)和最近邻凸包分类(NNCHC)的滚动轴承故障诊断方法。引入精细复合多尺度散布熵(RCMDE),将其粗粒化过程中平均值替换为最大值来表示数据段信息,以克服传统粗粒化过程的不足并突出故障特征。通过归一化操作减弱熵值计算时不同参数选择导致的熵值波动幅度,得到IRCMNDE。将IRCMNDE作为故障特征,使用NNCHC分类器对故障特征进行分类。经实验验证,该方法可达到98.98%的故障识别准确率,相比基于MDE(故障识别准确率为95.99%)和RCMDE(故障识别准确率为97.60%)的方法,能够更准确地提取滚动轴承的故障特征信息,提高承故障分类的准确性。   相似文献   

10.
将核学习方法的思想应用于K近邻法中,提出了一种核K近邻算法,算法的主要思想是:首先将原空间中待分类的样本经过一个非线性映射,映射到一个高维的核空间中,突出各类样本之间的特征差异,然后在这个核空间中进行K近邻分类.为了验证算法的有效性,分别利用人工和实际数据进行K近邻分类和核K近邻分类,实验结果显示对于一些特殊的类分布数据,核K近邻分类比K近邻分类具有更好的分类效果.  相似文献   

11.
专利信息检索作为快速获取专利信息的主要手段,在专利信息应用过程中发挥重要作用。本文在分析当前专利信息检索涉及的关键技术的基础上,进一步阐述了基于概念的专利信息检索技术。本文以对专利文献的内容分析为基础,按照文献中各部分的功能进行组织表示,对不同部分制定相应的特征选择策略。同时,对基于概念的专利信息检索技术中的两个关键问题即查询扩展和专利文献相似度计算方法进行了阐述。  相似文献   

12.
专利主题词是用以表述发明或实用新型名称的技术关键词,专利主题词的抽取是专利技术方案信息抽取的第一步,是填充信息抽取结果模板的有效依据和填充子之一。将信息抽取技术应用于中文专利摘要文本,在充分分析了专利摘要文本和专利标题特点的基础上,采用无指导的方法构建信息抽取模板,进而完成专利主题词的抽取。实验表明,该方法获得了较好的抽取效果。  相似文献   

13.
发动机飞行任务剖面的主成份聚类法   总被引:2,自引:5,他引:2  
本文提出了利用主成份分析对航空发动机飞行任务剖面进行分类的方法 ,并对某战斗机发动机 1 8个飞行任务剖面进行了聚类分析。选取了飞行高度、飞行马赫数、发动机转速以及发动机重心法向过载等 4个参数作为分类的原始依据参数。对上述 4个参数进行主成份分析 ,得到 4个独立的主成份 ,其中第一、二主成份的累积贡献率可达 81 .1 %。因此 ,可以根据主平面内各飞行任务剖面的第一、二主成分的分布情况直观地进行定性地分类。最后 ,本文利用重心法进行了定量的聚类 ,得到了分类的树状图。研究结果表明本文提出的方法是合理可行的  相似文献   

14.
将文本分类中的各种特征词选取方法引入到Naive Bayes邮件过滤模型(NBF)中,包括文档频度、信息增益、互信息、期望交叉熵、文本证据权、几率比及x2统计量.分析比较了这些方法的特点.实验结果显示在NBF中采用x2统计量选取邮件特征词有最好的效果.  相似文献   

15.
杨俊梅  许威  赵克 《航空计算技术》2004,34(4):102-104,107
平面几何智能辅导系统是一个适用面较广的家教辅导专家系统,由于几何问题的复杂性,使得系统的实现变得繁杂。本文首先简单介绍了系统的整体流程,具体讨论了系统的核心模块(规则库)的实现及其知识表示方法。分类是系统实现的关键技术。本系统已能成功地解决一般几何证明问题,满足不同层次学生的平面几何辅导需要。  相似文献   

16.
折臂式液压升降平台的设计突破了传统叉架式液压升降平台的设计思想,具有结构新颖、起降平稳、安全性高和通用性强等特点。本文介绍了折臂式液压升降平台的设计过程、工作原理和结构特点,由于折臂式液压升降平台的设计实现了创新,并申报获得了专利,因此具有在同行业推广应用的价值。  相似文献   

17.
随着社会的进步和信息技术的飞速发展。网络为人们提供了丰富的数据文本信息。但网络资源的多样性和数据管理的不规范性使得文本信息内容质量良莠不齐。对网络接收的多样的文本信息进行分析过滤的需求显得十分迫切。NDIS是微软提供的一种Windows平台下网络驱动开发接口。NDIS中间层可实现高效的数据截取。本文介绍一种基于NDIS中间层设备驱动的对文本进行主题识别继而分析过滤的信息防火墙的设计实现方案。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号