摘要:密度峰值聚类算法简单、高效, 可识别任意维度和形状类簇, 已在各领域得到广泛应用. 然而, 密度峰值聚类算法也存在一些问题, 如: 对截断距离参数敏感、难以发现低密度区域的类簇中心以及容易产生“多米诺效应”. 为此, 提出混合近邻和多簇合并的密度峰值聚类算法. 首先, 综合考虑样本的全局分布与局部结构, 引入自然近邻与$ k $近邻重新定义局部密度, 消除对截断距离参数的敏感, 并提高低密度区域样本的局部密度以增加类簇中心的识别度; 其次, 将样本划分为多个微簇, 并利用簇间关联度进行合并, 减少距离类簇中心较远的样本的分配错误, 从而有效缓解分配错误连带效应. 使用人工数据与真实数据进行测试, 结果表明, 所提出算法的综合性能优于对比算法.