首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 16 毫秒
1.
提出了一种基于域对象的文本过滤模型,该模型采用改进了的基于概念的向量空间模型来表示域对象模型。在过滤过程中,先建立域对象模型,然后将待过滤文本进行信息提取、文本分析,建立待过滤文本的临时模型,通过模型匹配来判断待过滤文本是否属于过滤范畴。实验证明该模型有较好的过滤性能。  相似文献   

2.
文本信息过滤技术需要解决的一个重要问题是对文档进行形式化处理,使得文本成为可计算和推理的信息。文中首先介绍了基于评估函数的文本特征抽取方法,分析评价了各种评估函数的优缺点,最后提出了一种利用特征抽取对文本信息进行过滤的方法,并说明如何使用评估函数对权重函数进行改进。  相似文献   

3.
针对传统的文本分类模型存在特征提取能力不足和分类准确率较低等问题,提出一种基于卷积神经网络和双向门控循环单元相结合(CNN-BiGRU)的文本分类方法。首先,以图书情报领域相关主题文本摘要为数据源,通过Word2vec进行文本向量化;其次,通过CNN获得输入文本信息的局部特征,并使用BiGRU保留文本中的顺序相关性;然后,选择softmax分类器输出分类结果;最后,与传统的机器学习分类方法和单一的深度神经网络模型分类方法进行对比实验。结果表明,在数据量大的情况下,文中提出的CNN-BiGRU分类模型具有更好的分类效果,其准确率、召回率和F1值均达到了95%以上,能够在一定程度上解决学术文本“信息过载”等问题。  相似文献   

4.
多媒体计算机技术是90年代计算机综合技术发展的结晶。本文从基本概念出发,系统地论述了多媒体计算机技术数据管理、图像处理、音频处理和超级文本处理等关键技术,并讨论了这些关键技术的性能、要点和实施方法。  相似文献   

5.
谈科技论文摘要的英译   总被引:1,自引:0,他引:1  
分析了目前科技论文摘要英译中存在的硬译、误译、不够精炼等问题 ,并指出要做好摘要英译应该注意的几个事项。  相似文献   

6.
针对需要识别海量试飞运营问题中的故障问题用于可靠性指标计算评估,基于深度学习中的文本卷积神经网络,提出一种试飞运营问题文本分类方法。通过收集大量的以人工分类的试飞运营问题文本作为实验数据集,并进行相应的预处理,运用Word2Vec模型将问题描述文本训练成词向量,构建出TextCNN模型进行训练完成问题文本的分类。最后通过实验表明,基于TextCNN模型的试飞运营问题分类方法可以为试飞运营问题自动化分类工作提供参考。  相似文献   

7.
设计并实现了面向内容安全的局域网监控系统。该系统包括网络数据内容还原和内容分析与过滤两大模块,采用旁听模式捕获网络数据包,利用协议分析和会话还原技术实现了应用数据还原;通过文本分析和过滤技术对还原后的应用数据进行安全性检验。该系统能够进行网络信息实时监控,有效地实现了局域网的信息内容监管。  相似文献   

8.
专利分类中基于主题的特征权重计算方法   总被引:1,自引:1,他引:0  
专利自动分类是一个大规模、多层次结构的复杂文本分类问题.其中特征权重计算是一个关键环节,关系到专利的文本表示能否体现出主题信息的问题.本文通过分析专利(标题和摘要)的特点,提出了一种基于主题的特征权重计算新方法.该方法通过考察特征与主题的相关性来确定权重,使专利的文本表示更趋近于文章的主题.实验结果表明,该方法优于一般的权重计算方法,取得了较好的效果.  相似文献   

9.
对等理论和目的论是基于不同翻译角度的两种翻译理论,他们既存在异性,也存在共性。本文通过对旅游文本的汉英翻译实践,旨在讨论他们在这一文本中统一的一面,为应用文本的翻译实践找到两种理论共同的理论基础。  相似文献   

10.
软件容错是提高软件可靠性的重要方法之一。我们可以认为软件可靠性提高技术有两种:容错技术与非容错技术。非容错技术是应用各种方法使软件不舍错误,即力求使软件在成为产品以前达到完美无缺,软件说明书设计、结构设计、软件测试等避错、除错方法都属于非容错技术。可是随着计算机的应用领域越来越广。软件越来越复杂。而人的思维是有局限性的,因而软件设计的缺陷是不可避免的。同时软件的复杂性又决定了我们不可能进行软件的“穷举测试”。因此对要求高可靠性的系统,仅仅用非容错方法是不够的。如核反应堆系统、飞行控制系统、航空专业应用。都必须采用容错技术来进一步提高其可靠性,因为容错软件可以系统发生错误的情况下,保证系纯正常运行。  相似文献   

11.
针对已有文本水印嵌入算法中所采用的二进制数据流描述文本水印时所表达的信息有限、水印容量较小的问题,提出了一种基于文本编码分割的医学影像文本水印算法,通过二维离散小波变换对医学影像的不同层次进行分解,将编码分割处理后的文本水印嵌入到小波分解的三级低频部分,实现了文本水印的隐秘嵌入。实验结果表明,该算法可提高医学影像文本水印容量2-3倍。  相似文献   

12.
介绍了在粗糙集理论和群体智能理论的基础上提出的一种优化的用于文本挖掘的蚁群聚类算法。实验证明,该算法有效地降低了文本特征向量的维数,提高了运行效率和准确性。  相似文献   

13.
OpenGL库没有提供直接的文本显示和处理函数,文献[4]给出一种基于GDI的OpenGL文本绘制方法,但该方法效率低,CPU占用量大。考虑到Windows多线程机制,对上述方法做出改进,提出了一种基于多线程的OpenGL文本绘制方法。该方法可有效利用多核处理器的优势,在对实时性要求较高或进行大批量文本数据绘制等方面有明显优势。实验结果表明,使用此方法能够有效提高文本绘制效率,改善用户体验。  相似文献   

14.
值此《载人航天》创刊二十周年之际,聚焦期刊出版历史及现状,利用文献计量、文本挖掘和可视化分析方法,对期刊各项出版指标进行统计分析,通过量化指标直观表现期刊的发展变化和出版特征,并间接反映期刊出版内容和工程各阶段关键技术攻关之间的内在关系,最终指导期刊出版的选题策划工作。  相似文献   

15.
如何从海量的信息中,提取有价值的目标信息是十分有意义的工作。信息提取系统可以快速、准确地从海量的文本信息中提取出自定义的一定格式、一定意义的信息。Internet应用的快速发展给信息提取提供了一个很好的应用前景。Internet发布的信息中有很大一部分都属于半结构化的文本。鉴于此,介绍了一个可以从半结构化网页中快速准确提取信息的模型SEMITXT,以及用于产生提取规则的一个有监督的学习算法,并给出了该模型在民航旅客信息处理中的应用实例。  相似文献   

16.
文本类型理论是德国学者莱斯与英国学者纽马克根据语言功能对文本进行功能划分的理论。根据此理论,旅游资料属于以感召功能为主的特殊文本。文本服务于译文读者,翻译时应遵循读者第一的原则,实现旅游资料对译文读者感召和信息功能的交流。文章分析了在此理论指导下的旅游资料这一特殊实用文体的翻译所应遵循的翻译原则和策略。  相似文献   

17.
同步字识别是 CCSDS 链路协议识别系统中的关键技术,对提高同步字匹配算法处理速度具有极大意义.简要分析了现有经典单模式串匹配算法原理和不足,提出了基于 QS 算法的改进算法.改进算法在预处理阶段增加了一个辅助移位值以得到更多关于模式串的信息,并且改进了字符匹配顺序和移位策略,对改进算法进行了性能测试,匹配效率明显提高.实验表明,改进算法可在二进制 CCSDS 链路协议识别的应用中获得更高的效率  相似文献   

18.
空中交通管制危险源特征提取是针对空中交通危险源记录的关键信息检索任务。基于文本特征的提取方法仅依据统计结果来对术语的重要性进行排序。通过引入专家知识来提取符合危险源定义的特征,提出了一种基于专家知识的特征提取方法来定义危险源特征并构建危险源分析框架。算法通过迭代对专家知识进行提炼和积累。实验结果表明,基于专家知识的特定语言处理后得到的数据集可以提取更多信息量的候选特征,以便通过k-means算法构建危险源记录的分析语境。该特征提取模型比其他四种算法获得了更高的精度,在空中交通管制运行数据集和通导数据集中分别达到82%和86%。此外,信息丰富的危险特征为安全管理部门的决策提供了支持,降低了隐患排查的成本。  相似文献   

19.
严译版《天演论》在翻译史上留下了里程碑式的足迹。大多数学者对严复的研究集中在其翻译作品与《天演论·译例言》中的“信达雅”翻译思想,较少涉猎其作品的副文本研究。本文结合定量与定性研究,分别从外在因素和内在因素分析严译版《天演论》中副文本产生的缘由,并探究其概念之递嬗,即严复其他译著副文本和晚清民国时期其他翻译家翻译名作的副文本概念的演化和发展,以期为严复翻译思想研究提供有益参考。  相似文献   

20.
专利主题词是用以表述发明或实用新型名称的技术关键词,专利主题词的抽取是专利技术方案信息抽取的第一步,是填充信息抽取结果模板的有效依据和填充子之一。将信息抽取技术应用于中文专利摘要文本,在充分分析了专利摘要文本和专利标题特点的基础上,采用无指导的方法构建信息抽取模板,进而完成专利主题词的抽取。实验表明,该方法获得了较好的抽取效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号