您的位置:网站首页 > 《中文科技期刊数据库》 > 工程技术 > 自动化计算机 > 计算机技术理论 > 摘要

三种主题分割方法的对比研究

《计算机工程与应用》2009年 第18期 | 石晶 李万龙   长春工业大学计算机科学与工程学院 长春130012 吉林大学计算机科学与技术学院 长春130012
★ 收藏 | 分享
  • 第1页
  • 第2页
  • 第3页
  • 第4页
论文服务:
摘 要:文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用。基于PLSA及LDA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系,而基于小世界模型的分割则依据小世界模型的短路径、高聚集性的特点实现片段边界的识别。从模型的特点、分割策略以及实验结果等角度对基于三种模型的分割进行对比。分析表明,基于LDA模型的分割比基于PLSA模型的分割具有更大的稳定性,且分割效果更好。基于小世界模型的分割策略更适合小世界模型特性明显的文本:
【分 类】【工业技术】 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法
【关键词】 文本分割 概率潜在语义分析模型 LDA模型 小世界模型
【出 处】 《计算机工程与应用》2009年 第18期 135-138页 共5页
【收 录】 中文科技期刊数据库