几种常用文本分类算法性能比较与分析

卢苇[1] 彭雅[2]

[1]北京交通大学软件学院,北京100044 [2]湖南大学计算机与通信学院,湖南长沙410082

摘  要:

分析了几种典型的文本分类算法的特点,并基于中文文本数据集和英文文本数据集对算法性能进行了综合评价.实验结果表明:对于英文文本数据,支持向量机具有最优的性能,但时间开销最大,贝叶斯算法速度较快;对于中文文本数据,由于分词的困难,使得算法性能普遍低于同等规模下在英文数据集上的性能.几种算法性能均随训练集规模的增大而有改善. (共3页)

相关文章:

主题相关 参考文献(5篇) 被引情况(1篇) 耦合文献(1篇) 
参考文献+更多
相关期刊+更多
    中国业务群个人门户,免费下载!
    征稿启事
    社区热帖+更多
    天元数据 维普资讯 版权所有 Copyright © 2001-2008 cqvip.com Inc. All rights reserved.
    渝ICP证 B2-20050021  违法和不良信息举报中心
    建议使用:1024x768分辨率,16位以上颜色