您的位置:网站首页 > 《中文科技期刊数据库》 > 人文社科 > 文化 > 情报学 > 摘要

基于改进编辑距离的中文相似句子检索

《高技术通讯》2004年 第7期 | 车万翔 刘挺 秦兵 李生   哈尔滨工业大学计算机学院信息检索研究室哈尔滨150001
购物车 | ★ 收藏 | 分享
摘 要:中文相似句子检索的方法在基于实例的机器翻译等中文信息处理领域,具有非常广泛的应用背景。本文提出的基于改进编辑距离的中文相似句子检索方法,在使用信息检索技术提高检索效率的同时,以普通编辑距离算法为基础,加入了词汇的语义信息,使之更加符合中文句子相似度计算的要求。改进编辑距离与单纯基于语义辞典计算句子相似度的方法相比,具有便于扩展,准确率高等优点。在基于大规模双语句对检索的英文辅助写作系统中使用该算法进行中文句子检索,最后获得了81.33%的查准率和95.31%的查全率。
【分 类】【文化、科学、教育、体育】 > 科学、科学研究 > 情报学、情报工作 > 情报检索 > 计算机情报检索系统【工业技术】 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
【关键词】 改进编辑距离 中文 相似句子 检索 英文 辅助写作 机器翻译
【出 处】 《高技术通讯》2004年 第7期 15-19页 共5页
【收 录】 中文科技期刊数据库