一种快速文本归类算法的设计与实现

高影繁[1] 马润波[2] 刘玉树[1]

[1]北京理工大学计算机科学技术学院,北京100081 [2]山西大学物理电子工程学院,山西太原030006

摘  要:

为实现无维数约减技术而使分类算法可行且不浪费空间存储的超稀疏文档向量,同时保证分类精度和速度且两者相互独立的目标,提出使用类别特征信息数据库、类别特征权重向量模型、待归类文档压缩向量表示法和改进的Roechio分类算法等技术实现文档的高速归类.在相同的Reuters测试语料集上,与CRF算法和改进的kNN算法进行对比实验.结果表明,在基本不牺牲精度的情况下,归类算法的分类速度明显高于对比算法. (共4页)

相关文章:

主题相关 参考文献(10篇) 耦合文献(43篇) 

参考文献

更多文章搜索 
中国业务群个人门户,免费下载!
相关学者+更多
征稿启事
相关文章+更多
社区热帖+更多
天元数据 维普资讯 版权所有 Copyright © 2001-2008 cqvip.com Inc. All rights reserved.
渝ICP证 B2-20050021  违法和不良信息举报中心
建议使用:1024x768分辨率,16位以上颜色