说明
1、是基于 Python 语言的机器学习工具包。
Sklearn 主要用 Python 编写,建立在 Numpy、Scipy、Pandas 和 Matplotlib 之上,一些核心算法也用 Cython 编写,以提高性能。
2. 有分类、回归、聚类、数据降维、模型选择和数据处理六个功能模块。
分类:确定样本属于哪个类别。常用算法有SVM(支持向量机)、最近邻(nearest neighbors)、随机森林(random forest)
Regression:预测与对象相关的连续值属性,常用算法有SVR(支持向量机)、岭回归(ridge regression)、Lasso
聚类:样本的无监督自动分类。常见的算法包括k-Means(k-means)、谱聚类(feature clustering)和mean-shift(均值偏移)。
降维:降低相关变量的维度。常见的算法包括PCA(主成分分析)、特征选择(feature selection)和非负矩阵分解(non-negative matrix factorization)。
模型选择:比较、验证、选择参数和模型,常用模块包括网格搜索、交叉验证、metrics
数据处理(Preprocessing):特征提取和归一化,常用模块包括预处理(preprocessing)、特征提取(feature extract)
这六个功能模块涉及四种算法,分类和回归属于监督学习,聚类属于无监督学习。
本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ 如何在python中检查一个数字是否是素数11/13
- ♥ 如何从python中的字典中获取一个值09/11
- ♥ 如何在python中编程09/17
- ♥ python try语句的执行原理11/08
- ♥ 如何在python脚本中使用睡眠09/19
- ♥ 如何判断python中是否存在进程09/11
内容反馈