- · 图书馆乐享数字资源主题活动[11/26]
- · 图书馆共享党员之家活动室启用[11/26]
- · 转发:教育系统“美好‘食’光””校园系列活动主题作品征集活动通知[11/03]
- · 红柳法学大讲堂第二十八期[11/03]
- · 关于举办兰州理工大学“红柳之星”2020校园新生才艺大赛的通知[10/30]
- · “科学家精神报告团”进校园活动通知[10/28]
- · 兰州理工大学2020年秋季学期国家普通话水平测试报名通知[10/27]
- · 2020年秋季学期至2021年寒假国内外线上线下交流项目报名通知[10/20]
分类问题中连续属性的离散化方法
作者: 张小峰 [1] ; 赵永升 [1] ; 刘智云 [2] ; 李明 [2]
关键词: 离散化 分类问题 正域 分类精度 discretization classification problem positive region classification accuracy
摘要:
提出了连续属性的一种离散化方法,指出与其他离散化方法的不同之处:离散化算法应是与挖掘目标息息相关的.研究和探讨了分类问题中的属性离散化方法,以分类精度和正域的势来评估每一步离散化过程,并将评估结果进行反馈,直至所有属性的属性值判断完为止.通过UCI机器学习数据库的实验表明,属性值个数的减少会提高在数据集上运行数据挖掘算法的效率,离散化后的分类正确率保持不变或有一定的提高.