维度概率摘要模型及其层次聚类算法
CSTR:
作者:
作者单位:

(1. 浙江工业大学计算机科学与技术学院,杭州310023;2. 温州职业技术学院信息技术系,浙江温州325035)

作者简介:

刘世华(1978-), 男, 高级工程师, 博士生, 从事数据挖掘、聚类分析的研究;黄德才(1958-), 男, 教授, 博士生导师, 从事数据仓库与数据挖掘等研究.

通讯作者:

E-mail: hdc@zjut.edu.cn

中图分类号:

TP273

基金项目:

水利部公益性行业科研专项基金项目(201401044);国家科技支撑计划子课题项目(2012BAD10B0101).


Hierarchical clustering algorithm with dimensions probability summary model
Author:
Affiliation:

(1. College of Computer Science & Technology, Zhejiang University of Technology,Hangzhou 310023,China;2. Department of Information Technology,Wenzhou Vocational & Technical College,Wenzhou 325035,China)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    提出一种维度概率摘要模型,将聚类产生的簇摘要信息采用各维度的概率分布来表示;定义点簇相似度、簇簇相似度等相似性度量方法;提出一种基于维度概率摘要模型的凝聚层次聚类算法.实验分析发现,所提模型和算法能够产生高质量的聚类,能够避免噪声点的影响并发现离群点,能够自动发现聚类,算法稳定可靠且对高维数据集聚类效果很好.

    Abstract:

    A dimensions probability summary model is proposed, which uses dimensions probability distributions to represent the cluster summary. Similarities from point to cluster and from cluster to cluster are defined as the similarity measurement. A hierarchical clustering algorithm based on the dimensions probability summary model is proposed. Experimental analysis shows that, the model and algorithm can produce high quality of the clustering, avoid the noise and find the outliers, and automatically determine the cluster number. The proposed algorithm is stable and reliable, and is suitable for high dimensional data clustering.

    参考文献
    相似文献
    引证文献
引用本文

刘世华,黄德才.维度概率摘要模型及其层次聚类算法[J].控制与决策,2017,32(8):1421-1426

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2017-07-17
  • 出版日期:
文章二维码