您的位置:网站首页 > 《中文科技期刊数据库》 > 工程技术 > 自动化计算机 > 计算机应用 > 摘要

LSI__LDA:一种混合特征降维方法

《计算机应用研究》2017年 第8期 | 史庆伟 从世源 唐晓亮   辽宁工程技术大学软件学院 辽宁葫芦岛125105
  • 第1页
  • 第2页
  • 第3页
  • 第4页
论文服务:
摘 要:LDA没有考虑到数据输入,在原始输入空间上对所有词进行主题标签,因对非作用词同样分配主题,致使主题分布不精确。针对其不足,提出了一种结合LSI和LDA的特征降维方法,预先采用LSI将原始词空间映射到语义空间,再根据语义关系筛选出原始特征集中关键的特征,最后通过LDA模型在更小、更切题的文档子集上采样建模。对复旦大学中文语料进行文本分类,新方法的分类精度较单独使用LDA模型的效果提高了1.50%。实验表明提出的LSI__LDA模型在文本分类中有更好的分类性能。
【分 类】【工业技术】 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
【关键词】 文本分类 特征降维 潜在语义索引 潜在狄利克雷分配
【出 处】 《计算机应用研究》2017年 第8期 2269-2273页 共5页
【收 录】 中文科技期刊数据库