您的位置:网站首页 > 《中文科技期刊数据库》 > 工程技术 > 自动化计算机 > 计算机应用 > 摘要

基于词频差异的特征选取及改进的TF-IDF公式

《计算机应用》2005年 第9期 | 罗欣 夏德麟 晏蒲柳   武汉大学 电子信息学院 湖北 武汉 430079
★ 收藏 | 分享
  • 第1页
  • 第2页
  • 第3页
论文服务:
摘 要:文档向量化的质量对于文本分类的速度和准确度有着很大的影响.对文档向量化中常用的TF-IDF公式,互信息量公式以及信息增益公式进行了分析.提出一种基于词频差异的特征选取方法和改进的TF-IDF公式,以提高特征选取质量和文本分类的速度及准确度.
【分 类】【工业技术】 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工)
【关键词】 特征选取 向量空间模型 文本分类 TF-IDF 信息增益 互信息量
【出 处】 《计算机应用》2005年 第9期 2031-2033页 共3页
【收 录】 中文科技期刊数据库