基于CNN-BiGRU的学术文本分类研究 |
| |
引用本文: | 薛丽,郑含笑,吴昊辰.基于CNN-BiGRU的学术文本分类研究[J].郑州航空工业管理学院学报(管理科学版),2023(3):61-68. |
| |
作者姓名: | 薛丽 郑含笑 吴昊辰 |
| |
作者单位: | 郑州航空工业管理学院 |
| |
基金项目: | 教育部人文社科基金项目(21YJC630151);;河南省自然科学基金(232300420125); |
| |
摘 要: | 针对传统的文本分类模型存在特征提取能力不足和分类准确率较低等问题,提出一种基于卷积神经网络和双向门控循环单元相结合(CNN-BiGRU)的文本分类方法。首先,以图书情报领域相关主题文本摘要为数据源,通过Word2vec进行文本向量化;其次,通过CNN获得输入文本信息的局部特征,并使用BiGRU保留文本中的顺序相关性;然后,选择softmax分类器输出分类结果;最后,与传统的机器学习分类方法和单一的深度神经网络模型分类方法进行对比实验。结果表明,在数据量大的情况下,文中提出的CNN-BiGRU分类模型具有更好的分类效果,其准确率、召回率和F1值均达到了95%以上,能够在一定程度上解决学术文本“信息过载”等问题。
|
关 键 词: | 深度学习 文本分类 卷积神经网络—双向门控循环单元 学术文本 |
|
|