导语:
本文主要介绍了关于python聚类算法如何选择的相关知识,包括kmeans算法python源码,以及python选择排序这些编程知识,希望对大家有参考作用。
说明
1.如果数据集是高维的,选择谱聚类作为子空间的一种。
2、如果数据量是中小型的,K均值会是更好的选择。
如果数据量超过100W条,可以考虑使用MiniBatchKMeans。
3、如果数据集中有噪声,选择DBSCAN。
使用基于密度的DBSCAN可以有效解决这个问题。
4、若追求更高的分类准确性,则选择谱聚类。
实例
import numpy as np
import matplotlib.pyplot as plt
# 数据准备
raw_data = np.loadtxt('./pythonlearn/cluster.txt') # 导入数据文件
X = raw_data[:, :-1] # 分割要聚类的数据
y_true = raw_data[:, -1]
print(X)
本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ python连接oracle时如何处理乱码12/15
- ♥ 为什么python注释会报错12/03
- ♥ yield是什么意思?python yield的用法10/01
- ♥ python模拟点击需要安装什么库?如何安装?01/11
- ♥ 如何解释python中的输入08/26
- ♥ python的eval函数的作用08/16
内容反馈