基于K-means的朴素贝叶斯分类算法的研究
张亚萍[1] 胡学钢[2]
[1]淮北煤炭师范学院物理系,安徽淮北235000 [2]合肥工业大学计算机与信息学院,安徽合肥230009
摘 要:
将K-means算法引入到朴素贝叶斯分类研究中,提出一种基于K-means的朴素贝叶斯分类算法。首先用K-means算法对原始数据集中的完整数据子集进行聚类,计算缺失数据子集中的每条记录与k个簇重心之间的相似度,把记录赋给距离最近的一个簇,并用该簇相应的属性均值来填充记录的缺失值,然后用朴素贝叶斯分类算法对处理后的数据集进行分类。实验结果表明,与朴素贝叶斯相比,基于K-means思想的朴素贝叶斯算法具有较高的分类准确率。 (共3页)学科分类:
TP301.6[工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法 > 算法理论]参考文献

















cqvip.com