分类问题中连续属性的离散化方法

作者: 张小峰 [1] ; 赵永升 [1] ; 刘智云 [2] ; 李明 [2]

关键词: 离散化分类问题正域分类精度 discretization classification problem positive region classification accuracy

摘要：提出了连续属性的一种离散化方法，指出与其他离散化方法的不同之处：离散化算法应是与挖掘目标息息相关的．研究和探讨了分类问题中的属性离散化方法，以分类精度和正域的势来评估每一步离散化过程，并将评估结果进行反馈，直至所有属性的属性值判断完为止．通过UCI机器学习数据库的实验表明，属性值个数的减少会提高在数据集上运行数据挖掘算法的效率，离散化后的分类正确率保持不变或有一定的提高．

上一篇：基于LCMV的IQRD—SMI自适应数字波束形成算法
下一篇：使用增量SVM进行文本分类

分类问题中连续属性的离散化方法

作者: 张小峰 [1] ; 赵永升 [1] ; 刘智云 [2] ; 李明 [2]

关键词: 离散化 分类问题 正域 分类精度 discretization classification problem positive region classification accuracy

关键词: 离散化分类问题正域分类精度 discretization classification problem positive region classification accuracy