首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于编辑距离相似度的文本校验技术研究与应用
引用本文:何锋,谷锁林,陈彦辉.基于编辑距离相似度的文本校验技术研究与应用[J].飞行器测控学报,2015,34(4):389-394.
作者姓名:何锋  谷锁林  陈彦辉
作者单位:酒泉卫星发射中心;酒泉卫星发射中心;酒泉卫星发射中心
摘    要:树形结构的文本配置在分布式的测控数据处理软件中使用广泛,它的正确性对数据处理而言至关重要。为了实现树形结构的文本配置自动检查和纠错,通过引入LD(Levenshtein Distance)编辑距离算法,把字符串的编辑操作推广到多叉树之间。在此基础上定义了多叉树之间的编辑距离,建立了衡量多叉树之间相似度的方法,设计了基于模糊匹配的文本配置自动校对流程,解决了精确匹配时由字符的多义性导致的查全率失真和误判的问题。根据实验结果,查全率和查准率分别达到了87.5%和100%,有效提高了基于树形结构的文本配置自动校验时的可靠性。

关 键 词:字符串相似度  树编辑距离  模糊匹配  文本校验

Text Proofreading Technology Based on Levenshtein Distance Similarity
HE Feng,GU Suolin and CHEN Yanhui.Text Proofreading Technology Based on Levenshtein Distance Similarity[J].Journal of Spacecraft TT&C Technology,2015,34(4):389-394.
Authors:HE Feng  GU Suolin and CHEN Yanhui
Institution:Jiuquan Satellite Launch Center;Jiuquan Satellite Launch Center;Jiuquan Satellite Launch Center
Abstract:
Keywords:similarity between strings  tree Levenshtein distance  fuzzy matching  text proofreading
本文献已被 CNKI 等数据库收录!
点击此处可从《飞行器测控学报》浏览原始摘要信息
点击此处可从《飞行器测控学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号