您的位置:网站首页 > 《中文科技期刊数据库》 > 工程技术 > 自动化计算机 > 计算机应用 > 摘要

基于局部主题判定与抽取的多文档文摘技术

《自动化学报》2004年 第6期 | 秦兵 刘挺 李生   哈尔滨工业大学计算机科学与技术学院 哈尔滨 150001
在线阅读 云发表 | ★ 收藏 | 分享
  • 第1页
  • 第2页
  • 第3页
  • 第4页
摘 要:提出了一个通过对同一主题的多文档集合内局部主题的判定和抽取生成多文档文摘的方法.首先在对多文档集合中句子依存分析和语义分析的基础上进行相似度计算,将相似句子经过聚类形成多文档集合内不同的局部主题,然后进行每个局部主题中质心句的抽取和排序,生成多文档文摘.该方法实现了文摘长度随文档内容自动确定,从而保证了文摘中包含的信息的全面和简洁.最后文中还给出了多文档文摘的评价方法和实验结果,文摘的平均精确率和平均压缩率分别为71.4%和25.2%.
【分 类】【工业技术】 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工)
【关键词】 多文档文摘 局部主题 聚类
【出 处】 《自动化学报》2004年 第6期 905-910页 共6页
【收 录】 中文科技期刊数据库