基于连通分量的分类变量聚类算法
CSTR:
作者:
作者单位:

1. 西安理工大学计算机科学与工程学院,西安710048;
2. 陕西应用物理化学研究所,西安710061.

作者简介:

周红芳

通讯作者:

中图分类号:

TP311.13

基金项目:

国家自然科学基金项目(61402363, 61272284);陕西省工业攻关项目(2014K05-49);陕西省自然科学基础研究计划项目(2014JQ8361);西安市碑林区科技计划项目(GX1405);西安市科学计划项目(CXY1339(5));校特色研究计划项目(116-211302).


A clustering algorithm for categorical variables based on connected components
Author:
Affiliation:

1. School of Computer Science and Engineering,Xi’an University of Technology,Xi’an 710048,China;
2. Shanxi Applied Physics and Chemistry Research Institute,Xi’an 710061,China.

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对分类变量相似度定义存在的不足, 提出一种新的相似度定义. 利用新的相似度定义, 将数据集抽象为无向图, 将聚类过程转化为求无向图连通分量的过程, 进而提出一种基于连通分量的分类变量聚类算法. 为了定量地分析该算法的聚类效果, 针对类别归属已知的数据集, 提出一种新的聚类结果评价指标. 实验结果表明, 所提出的算法具有较高的聚类精度和聚类效率.

    Abstract:

    For the insufficient similarity concepts for categorical variables, a new more reasonable concept is proposed. Firstly, a data set is organized into an undirected graph by the new definition. The clustering process is converted into the problem of determining connected components in the undirected graph. Then a novel clustering algorithm for categorical variables based on connected components is proposed. In order to analyze the clustering results quantitatively, a new index is proposed for the known labels. Finally, the experimental results show that the proposed algorithm has a higher clustering precision and faster execution speed compared with several existing ones.

    参考文献
    相似文献
    引证文献
引用本文

周红芳 周扬 张晓鹏 谈姝辰.基于连通分量的分类变量聚类算法[J].控制与决策,2015,30(1):39-45

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2013-10-29
  • 最后修改日期:2014-03-20
  • 录用日期:
  • 在线发布日期: 2015-01-20
  • 出版日期:
文章二维码