基于平均差异度优选初始聚类中心的改进K-均值聚类算法
CSTR:
作者:
作者单位:

(湖南理工学院信息与通信工程学院,湖南岳阳414006)

作者简介:

李武(1977-), 男, 教授, 博士, 从事决策分析、复杂系统建模与优化等研究;赵娇燕(1991-), 女, 硕士生, 从事智能信息处理的研究.

通讯作者:

E-mail: liwu0817@163.com

中图分类号:

N945

基金项目:

国家自然科学基金项目(61473118);湖南省自然科学基金项目(2015JJ2074);湖南省高校创新平台开放基金项目(13K102);湖南省科技计划项目(2016TP1021).


Improved K-means clustering algorithm optimizing initial clustering centers based on average difference degree
Author:
Affiliation:

(College of Information and Communication Engineering,Hu'nan Institute of Science and Technology,Yueyang 414006,China)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对K-均值聚类算法对初始聚类中心存在依赖性的缺陷,提出一种基于数据空间分布选取初始聚类中心的改进算法.该算法首先定义样本距离、样本平均差异度和样本集总体平均差异度;然后将每个样本按平均差异度排序,选择平均差异度较大且与已选聚类中心的差异度大于样本集总体平均差异度的样本作为初始聚类中心.实验表明,改进后的算法不仅提高了聚类结果的稳定性和正确率,而且迭代次数明显减少,收敛速度快.

    Abstract:

    Aiming at the dependence on initial clustering centers of the K-means clustering algorithm, an improved algorithm is proposed. In the improved K-means algorithm, the initial clustering centers are selected according to the distribution of data spatial. The distance between two samples, the average difference of each sample, and total average difference of sample set are defined. Then the average difference of each sample is sorted. The sample with larger average difference is selected as the initial clustering center if its difference from the selected cluster is larger than average difference. Experimental results show that the stability and accuracy of the clustering results are increased by using the improved algorithm, and the convergence speed is also accelerated.

    参考文献
    相似文献
    引证文献
引用本文

李武,赵娇燕,严太山.基于平均差异度优选初始聚类中心的改进K-均值聚类算法[J].控制与决策,2017,32(4):759-762

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2017-03-28
  • 出版日期:
文章二维码