您的位置:网站首页 > 《中文科技期刊数据库》 > 工程技术 > 自动化计算机 > 计算机应用 > 摘要

基于潜在语义索引和自组织映射网的检索结果聚类方法

《计算机研究与发展》2009年 第7期 | 陈毅恒 秦兵 刘挺 王平 李生   哈尔滨工业大学计算机学院信息检索研究室 150001
  • 第1页
  • 第2页
  • 第3页
  • 第4页
论文服务:
摘 要:随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型,在词条的权重中引入了语义关系,对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法,并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高.
【分 类】【工业技术】 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 翻译机
【关键词】 检索结果聚类 潜在语义索引 自组织映射网 标签 边界划分
【出 处】 《计算机研究与发展》2009年 第7期 1176-1183页 共8页
【收 录】 中文科技期刊数据库