- · 图书馆乐享数字资源主题活动[11/26]
- · 图书馆共享党员之家活动室启用[11/26]
- · 转发:教育系统“美好‘食’光””校园系列活动主题作品征集活动通知[11/03]
- · 红柳法学大讲堂第二十八期[11/03]
- · 关于举办兰州理工大学“红柳之星”2020校园新生才艺大赛的通知[10/30]
- · “科学家精神报告团”进校园活动通知[10/28]
- · 兰州理工大学2020年秋季学期国家普通话水平测试报名通知[10/27]
- · 2020年秋季学期至2021年寒假国内外线上线下交流项目报名通知[10/20]
一种适应于不平衡数据集的改进TANC算法
作者: 赵小强 [1,2] ; 杨佳敏 [1]
关键词: 机器学习 不平衡数据集 TANC算法 Relief算法
摘要:传统的分类方法对不平衡数据集进行分类时对数据集中少数类的分类准确率不高,而少数类往往对结果的影响尤为重要.为此提出一种适应于不平衡数据集的改进树扩展型朴素贝叶斯(TANC)算法,该算法首先利用Relief算法对样本中的少数类进行权重分配,然后通过训练数据集,使缺失数据补齐,并通过将属性分割成多个有限区间,使连续数据离散化,将修改后的训练集用以训练TANC,最后通过TANC算法对数据集进行分类.基于UCI标准数据集上的实验结果表明,该算法的整体性能优于TANC算法.