基于边缘峰度度量的特征缩减模糊聚类算法
CSTR:
作者:
作者单位:

1. 江南大学 数字媒体学院,江苏 无锡 214122;2. 贵州民族大学 工程实训中心,贵阳 550025

作者简介:

通讯作者:

E-mail: 408206387@qq.com.

中图分类号:

TP391

基金项目:

国家自然科学基金面上项目(61572236).


Feature-reduction fuzzy clustering algorithm based on marginal kurtosis measure
Author:
Affiliation:

1. Digital Media School,Jiangnan University,Wuxi 214122,China;2. Engineer Training Center, Guizhou Minzu University,Guiyang 550025,China

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    对含有不重要特征、冗余特征的数据进行聚类,采用特征缩减模糊聚类(feature reduction fuzzy c-means, FRFCM)算法是有效的.该算法使用特征的均值方差比(mean-to-variance ratio,MVR)度量特征的重要性,删除权重小于阈值的特征,仅保留重要特征进行聚类,以提升算法的性能和速度.但该算法存在以下不足:1)数据归一化后,特征的MVR值会发生改变,重要特征的MVR值可能会变小,不重要特征的MVR值可能会变大;2)一些数据的重要特征,其MVR指标未必大;3)FRFCM算法特征权重分配依赖于初始化,不恰当的初始化会使算法给出错误的权重分配,使得聚类过程中算法会删除重要特征而保留不重要特征,造成FRFCM算法的聚类结果不正确.对此,首先构造边缘峰度度量(marginal kurtosis measuree,MKM)指标来度量特征的重要性;然后基于该指标提出一种新的、具有鲁棒的特征缩减模糊聚类算法.通过在人工数据集和真实数据集上的验证,表明所提出的算法是有效的.

    Abstract:

    The feature reduction fuzzy c-means(FRFCM) algorithm has been proven effective for clustering data with redundant features. The FRFCM can automatically compute individual feature weight, and simultaneously reduce these redundant feature component. However, it still has the following disadvantages: 1) the large MVR value of original features may become small if the data is normalized, and vice versa. 2) the MVR value of important features of some datasets is not necessarily large. 3) feature assignment is sensitive to initialization. The FRFCM may produce wrong weights if initialization is improper, which can deteriorate the clustering accurancy. Therefore, we first devise a new index, named marginal kurtosis measure(MKM), to measure the importance of features instead of using MVR index. Then, a novel and robust feature reduction fuzzy c-means clustering algorithm based marginal kurtosis measure is proposed. Experiments on synthetic and real-world dataset demonstrate that the proposed method is effective and efficient.

    参考文献
    相似文献
    引证文献
引用本文

潘兴广,王士同.基于边缘峰度度量的特征缩减模糊聚类算法[J].控制与决策,2021,36(11):2665-2673

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2021-09-26
  • 出版日期: 2021-11-20
文章二维码