基于样本特性欠取样的不均衡支持向量机
DOI:
CSTR:
作者:
作者单位:

哈尔滨工程大学

作者简介:

陶新民

通讯作者:

中图分类号:

TP391

基金项目:

国家自然科学基金面上项目;中国博士后科学基金;中国博士点新教师基金;黑龙江省博士后基金项目


Support vector machine for unbalanced data based on sample properties under-sampling approaches
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对传统支持向量机在数据失衡的情况下分类效果很不理想的问题, 提出一种基于样本特性欠取样的不均
    衡SVM分类算法. 该算法首先在核空间中依据样本信息量选择一定比例的靠近不均衡分类界面的多数类样本; 然后
    根据样本密度信息选择最具有代表性的均衡多数类样本点, 在减少多数类样本的同时使分类界面向多数类方向偏
    移. 实验结果表明, 所提出的算法与其他不均衡数据预处理方法相比, 能有效提高SVM算法在失衡数据中少数类的分类性能、总体分类性能和鲁棒性.

    Abstract:

    The classification result of classical support vector machine algorithm in the case of unbalanced data set is not satisfactory, so a novel under-sampling algorithm based on sample properties is presented. According to sample information in the kernel space, a certain percentage of majority instances located near the classification interface are selected. Then according to the sample’s density, the representive majortiy samples in the selected samples are selected, which can not only reduce the number of majority instances, but also make the SVM classification interface bias toward the majority instances. In the experiments, the proposed approach is compared with other data-preprocess methods for unbalanced dataset classification, the experimental results demonstrate that the proposed method can improve classification performance of SVM in the minority class data, the overall classification performance and robustness.

    参考文献
    相似文献
    引证文献
引用本文

陶新民 郝思媛 张冬雪 李震.基于样本特性欠取样的不均衡支持向量机[J].控制与决策,2013,28(7):978-984

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2012-03-22
  • 最后修改日期:2012-08-25
  • 录用日期:
  • 在线发布日期: 2013-07-20
  • 出版日期:
文章二维码