基于概率分布估计的混合采样算法
CSTR:
作者:
作者单位:

东北大学 a. 信息科学与工程学院,b. 医学影像计算教育部重点实验室,沈阳110004

作者简介:

曹鹏

通讯作者:

中图分类号:

TP273

基金项目:

国家自然科学基金项目(61001047);中央高校基本科研业务费专项资金项目(N110618001).


Hybrid sampling algorithm based on probability distribution estimation
Author:
Affiliation:

a. College of Information Science and Engineering,b. Key Laboratory of Medical Image Computing of Ministry of Education,Northeastern University,Shenyang 110004

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    在类别不均衡的数据中, 类间和类内不均衡性问题都是导致分类性能下降的重要因素. 为了提高不均衡数据集下分类算法的性能, 提出一种基于概率分布估计的混合采样算法. 该算法依据数据概率分别对每个子类进行采样以保证类内的均衡性; 并扩大少数类的潜在决策域和减少多数类的冗余信息, 从而同时从全局和局部两个角度改善数据的平衡性. 实验结果表明, 该算法提高了传统分类算法在不均衡数据下的分类性能.

    Abstract:

    In the class imbalanced data distribution, both the between-class and within-class imbalance issues are critical factors to decrease the performance. To improve the performance of classifier algorithm on the imbalanced data, a hybrid sampling algorithm based on probability distribution estimation is proposed. The approach re-samples the data of subclass to balance the distribution in each class based on probability distribution estimation. Moreover, it expands the decision region of minority class and removes the redundant information of majority class, so as to solve the imbalance issues from both global and local perspectives simultaneously. Experimental results show that the proposed method improves the classification performance for imbalanced data.

    参考文献
    相似文献
    引证文献
引用本文

曹鹏 李博 栗伟 赵大哲.基于概率分布估计的混合采样算法[J].控制与决策,2014,29(5):815-520

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2013-02-27
  • 最后修改日期:2013-05-10
  • 录用日期:
  • 在线发布日期: 2014-05-20
  • 出版日期:
文章二维码