知行编程网知行编程网  2022-03-17 19:00 知行编程网 隐藏边栏 |   抢沙发  3 
文章评分 0 次,平均分 0.0

你还记得吗?那些最基础的机器学习知识。

来自 | AI遇见机器学习

机器学习定义


深度学习的兴起引领了人工智能的有一股热潮,特别是阿尔法狗(AlphaGO)在围棋中战胜了世界冠军之后,各大社交媒体大肆宣传,把深度学习形容的玄乎其玄,人工智能的概念就走进千家万户了。

回到正题,这篇推文是复习一下机器学习的基础知识,首先以下是机器学习的介绍和定义。


机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。


对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E中学习。


简单来说,机器学习是从现实问题出发,以计算机及计算机网络为计算平台,利用概率论、统计学等知识建立数学模型,采用凸分析等学科知识作为模型优化的理论基础。在大量数据的驱动下,提升模型的性能,使之能更好的完成某一个任务。(所谓的经验就是数据)


举个栗子:

例如:我们想知道某市房子的住宅面积和单位面积房价的关系(任务T)。显然预测值和实际值的残差(性能度量P)的绝对值越小,证明模型的预测效果越好。现在我们手头里有一堆该市的房价信息以及房价对应的住宅面积的数据(经验E),我们希望通过这些数据获得一个模型,使得有给定的输入(住宅面积),会得到一个非常接近真实值的一个输出(房价),于是乎我们将一个实际问题转化为求解具体模型的问题。

(PS:残差:预测值与实际值的差)


人工智能、机器学习、深度学习的关系


另外还要注意不要弄错人工智能、机器学习以及深度学习之间的关系,如下图所示

你还记得吗?那些最基础的机器学习知识。

机器学习是实现人工智能的一种途径,而深度学习则是机器学习中当前比较火的一个方法。


机器学习的学习类别


机器学习按学习类别可以分为:

监督学习,无监督学习,半监督学习,强化学习


1. 监督学习:模型学习给定的训练数据,使得对其他的输入,能输出与真实值接近的输出。训练数据包括输入的特征和对应输出的结果。主要解决分类和回归任务。

2. 无监督学习:是指模型学习给定的特征,训练数据没有提供作为评判正确或误差的输出。主要是聚类。

3. 半监督学习:介于监督学习与无监督学习之间的一种学习方式。

4. 强化学习:即是通过建立一个反馈系统来提升模型的性能,当模型做对了,则给予奖励,错误即给予惩罚的一种学习方式。


数据(特征)的种类


数据(特征)也分为离散型和连续型两种。

1. 离散型:如性别,离散型数据的取值有限个。

2. 连续型:如身高,连续型数据的取值无限个。


PS:机器学习中常常把连续型特征转变为离散型特征,以上面房价-住宅面积为例,也许在某一个区间内,住宅面积波动对房价的影响非常小,选用离散型数据某种程度上是模型变得简单,同时也可以降低数据噪声(异常数据)对训练的影响。


几个空间的概念


1. 输入空间:输入所有可能的取值构成输入空间(如上面的例子,住宅面积就是大于0的实数)

2. 输出空间:输出所有可能的取值构成输出空间(房价也是大于零的实数)

3. 特征空间:所有特征向量存在的空间称为特征空间,模型是定义在特征空间上的(住宅面积是一个特征,上例的输入空间和特征空间一致,但是也有不一致的情况,这种情况以后会提到)

4. 假设空间:即所有可能模型的集合(当你打算用一元一次方程来拟合上例的时候,那么你的假设空间就是所有可能的一元一次方程的集合)


机器学习的三要素


接下来复习一下机器学习的三要素

1. 模型:但你想解决某一个问题的时候,你回去思考,用什么模型才能达到更好的效果(线性回归、逻辑回归...),只有你确定了怎么使用模型,你才能确定的假设空间,你才能开始学习(学习的过程即是在假设空间中找到最优模型的过程)。


2. 策略:如何使的模型达到最优,以考试为例,如果你想拿高分,那么你把题都做对了不就高分了吗。但从另一个角度想只要把错题做对,从错误吸取教训,渐渐的就能考到高分。以上就提到了两种策略,从正例入手,或从降低错误率(误差)入手。还有很多不同的学习策略,比如决策树ID3是基于信息增益来学习的,在这里不多阐述,只要知道选择的学习策略不同,有可能对模型的性能会有很大的影响。


3.算法:算法是把学习的步骤的具体描述,因为我们是用计算机来进行训练模型,只有把学习过程转化为具体算法,才可以用代码实现具体的功能。

— 完 —


为您推荐

小白都能看懂的神经网络教程:从原理到优化如此简单

从一个骗局谈生活中的基础算法

9000星,微软开源的计算器Github项目突然火了

百度2019春季实习生招聘正式开幕!

本篇文章来源于: 深度学习这件小事

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享