一种有效的分类型数据聚类方法
DOI:
CSTR:
作者:
作者单位:

1. 长沙理工大学
2. 长沙理工大学数学与计算科学学院

作者简介:

洪亮亮

通讯作者:

中图分类号:

基金项目:

国家自然科学基金资助项目;湖南省科技计划项目基金项目


Efficient categorical data clustering method
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    鉴于传统的??-means 聚类算法只限于处理数值型数据, 将??-means 算法扩展到分类型数据域, 提出一种分
    类型数据聚类方法. 根据与每个分类属性的每个值相关的数据分布信息, 同时结合数据的纵向与横向分布来评价数
    据对象与类之间的差异性, 定义了一种新的距离度量. 该方法能发现同一属性不同值间的内在关系, 并能有效地度量
    对象间的差异性. 用UCI 中的数据集对所提算法进行验证, 实验结果表明了该算法具有较好的聚类效果.

    Abstract:

    The traditional ??-means clustering algorithm is only for numerical data. Therefore, a categorical data clustering
    method is proposed through extending the??-means algorithm to categorical data domain. In accordance with the information
    of data distribution correlated to each value of each categorical attribute, and at the same time combined with the vertical
    and horizontal distribution of the data to measure the difference between data object and the class, a new distance metric is
    defined. This method can find the intrinsic relationship between the different values of the same attribute, and can measure
    the difference between objects effectively. The performance of the proposed algorithm is verified on the dataset of the UCI.
    Experimental results show that the algorithm has better clustering results.

    参考文献
    相似文献
    引证文献
引用本文

罗可 洪亮亮 童小娇.一种有效的分类型数据聚类方法[J].控制与决策,2011,26(10):1542-1544

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2010-06-21
  • 最后修改日期:2010-09-02
  • 录用日期:
  • 在线发布日期: 2011-10-20
  • 出版日期:
文章二维码