首页 | 本学科首页   官方微博 | 高级检索  
     检索      

专利分类中基于主题的特征权重计算方法
引用本文:赵环宇,张桂平,季铎,蔡东风.专利分类中基于主题的特征权重计算方法[J].沈阳航空工业学院学报,2009,26(1).
作者姓名:赵环宇  张桂平  季铎  蔡东风
作者单位:沈阳航空工业学院知识工程中心,辽宁,沈阳,110034
基金项目:国家高技术研究发展计划(863计划),教育部科学技术研究重点项目 
摘    要:专利自动分类是一个大规模、多层次结构的复杂文本分类问题.其中特征权重计算是一个关键环节,关系到专利的文本表示能否体现出主题信息的问题.本文通过分析专利(标题和摘要)的特点,提出了一种基于主题的特征权重计算新方法.该方法通过考察特征与主题的相关性来确定权重,使专利的文本表示更趋近于文章的主题.实验结果表明,该方法优于一般的权重计算方法,取得了较好的效果.

关 键 词:专利分类  文本分类  特征权重

A topic-based feature weight calculation method for patent categorization
ZHAO Huan-yu,ZHANG Gui-ping,JI Duo,CAI Dong-feng.A topic-based feature weight calculation method for patent categorization[J].Journal of Shenyang Institute of Aeronautical Engineering,2009,26(1).
Authors:ZHAO Huan-yu  ZHANG Gui-ping  JI Duo  CAI Dong-feng
Institution:Knowledge Engineering Center;Shenyang Institute of Aeronautical Engineering;Liaoning Shenyang 110034
Abstract:Patent categorization is a large-scale and multi-hierarchy text categorization problem,in which feature weight calculation is a crucial step since it decides whether text representation can reflect topic information.On the basis of thorough analysis on the characteristics of patent title and abstract,this paper proposed a topic-based feature weight calculation method,and the weight determination with correlation of feature and topic makes the patent text closer to the topic.Experimental results show that to...
Keywords:patent categorization  text categorization  feature weight  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号