基于可疑实例影响度分析改进的C4.5 rules算法

王强 胡学钢

合肥工业大学计算机与信息学院,安徽合肥230009

摘  要:

决策树学习算法是数据挖掘中一类经典的分类算法。传统的决策树学习算法把数据集合中的实例同等对待,而忽略了实例之间存在的可疑性和影响度差异,导致错误实例扭曲了学习结果,严重影响学习质量。在此提出基于可疑实例影响度分析改进的C4.5rules算法,在给定一个噪音集合后,首先把可疑实例与原集合划分开,并对可疑实例的影响度进行分析和度量,然后依据分类规则对可疑实例的覆盖情况进行重新排序和分类预测。算法在对分类规则重排序后将错误实例对学习结果的影响最小化,得出尽可能接近正确数据的学习结果。将此算法与经典的C4.5 rules算法进行实验比较,结果表明该算法有着良好的性能。 (共4页)

相关文章:

主题相关 参考文献(9篇) 耦合文献(353篇) 
参考文献+更多
相关期刊+更多
    中国业务群个人门户,免费下载!
    征稿启事
    社区热帖+更多
    天元数据 维普资讯 版权所有 Copyright © 2001-2008 cqvip.com Inc. All rights reserved.
    渝ICP证 B2-20050021  违法和不良信息举报中心
    建议使用:1024x768分辨率,16位以上颜色