密度峰值聚类算法研究综述 |
| |
作者姓名: | 王森 邢帅杰 刘琛 |
| |
作者单位: | 华东交通大学理学院 |
| |
基金项目: | 江西省自然科学基金项目(20192ACBL20010); |
| |
摘 要: | 密度峰值聚类(DPC)是一种新提出的基于密度和距离的聚类算法,由于其原理简单,无需迭代和能处理形状数据集等优点,正在数据挖掘领域得到广泛应用。但DPC算法也有着一定的缺陷,如:对截断距离参数敏感,初始聚类中心的选择非自动化,后续标签分配存在链式问题,时间复杂度较高等。文章对DPC算法的研究现状进行了总结与整理,首先介绍了DPC的算法原理和流程;其次,针对DPC算法的不足对DPC算法的优化进行概括和分析,指出了优化算法的核心技术以及优缺点;最后,对DPC算法未来可能面对的挑战和发展趋势进行展望。
|
关 键 词: | 聚类算法 密度峰值 截断距离 初始聚类中心 微簇合并 时间复杂度 |
|
|