摘要:密度峰值聚类算法(DPC)能够识别任意形状的类簇, 但存在两大明显不足: 一是在密度分布不均的数据集中不能正确发现稀疏集群的聚类中心; 二是剩余点分配策略容易引起连锁反应导致数据点归类错误. 为此, 提出一种基于双向代表点(BRP)和相互$K $近邻(MKNN)的密度峰值聚类算法, 称为BRPMK-DPC. 首先, 设计一种基于正向$K $近邻代表点和逆向逆$K $近邻代表点的局部密度计算方法, 好处是可以在密度分布不均的数据集中高效识别正确的聚类中心; 其次, 提出一种相互$K $近邻的剩余点分配方法, 在分配过程中具有自适应性, 避免衍生类DPC算法采用固定$K $值带来的劣势; 最后, 在人工合成数据集和真实数据集上进行测试, 实验结果表明所提出的算法不仅能够高效识别密度不均集群的聚类中心, 而且在大部分数据集上的聚类性能优于其他7种对比算法.