AI学习笔记 | 初识机器学习（一）

从去年开始就有参与公司的AI项目，这个参与过程主要是偏执行，即按照要求实现产品某部分功能的需求即可，很少思考各个环节背后的原因是什么，如何权衡如何做决策，当然，当时的积累也不足以支撑我给意见，更不用说是做决策了。现在成为另一个AI项目负责人之后，AI方案、资源协调、风险管理、成本投入等等所有的事都需要自己去思考、权衡、沟通、解决。

AI学习笔记 | 初识机器学习（一）

与普通的产品和项目不同的是，AI是产品的核心，所以算法工程师是我最常沟通的对象，必须要理解他们的语言。为了能更顺畅的与算法工程师沟通，把控项目质量与风险，特意买了两本书，开始恶补AI知识，以下是本周的学习成果，分为两部分：AI的概念和机器学习分类。

一 AI的概念

1、AI的定义

AI（Artificial Intelligence）人工智能，目前已经成为计算机科学领域的一个重要分支，即让计算机也像人类一样学习，通过观察和训练，发现事物规律，从而获得分析问题、解决问题的能力，甚至能超越人的思维和判断力，我们把计算机学习的方法叫做机器学习，机器学习的结果叫做模型。

2、AI的价值

其实人类绝大多数对事情的认知是基于概率，比如医生诊断病人，根据病人的症状再结合理论知识以及多年的经验，会得出一个大概率的判断，人工智能的本质就是实现推断的概率可以无限逼近100%,最终代替人做判断，节省人力成本，以及帮助解决一些人类未知的问题。

3、AI的产品形态

AI的产品形态类似一个“中间件”，不直接与用户完成交互，需要借助传统的应用程序，应用程序直接与用户进行交互，同时提交输入数据给模型，模型处理后返回输出数据给应用程序，应用程序再转化为合适的呈现方式反馈给用户。

二、机器学习的分类

1、有监督学习

在大人教导小孩认识事物时，比如认识一只大熊猫，大人一般会对着熊猫的照片这么教导：你看，大熊猫的体型很大，头圆圆的，有黑白相间的毛，喜欢吃竹子…，当小孩听多了或者见多了的时候，脑子里慢慢的会形成一种直观感觉，并记住熊猫的特征，让下次再遇到大熊猫时，不需要大人告诉，自己也能认识，这个过程其实就是有监督学习。

有监督学习要求训练集的每一条数据都是带有特征和标签（答案）的，通过学习、分析训练样本的特征和标签之间的关系，得到训练模型，再利用模型将新的输入数据映射为相应的输出，对输出进行判断从而实现分类。

有监督学习算法最常见的应用场景或领域：如语音、文字、图像识别等。基于海量带有标签的样本库训练模型，并落地产品化，如语音助手、人脸识别等产品。

2、无监督学习

在小孩长大成年后，对于世界的认知不再局限于其他人的教导和答案，而是在看了大千世界之后，形成了自己的标准答案，比如关于审美标准：他就认为短发、小个子的女生就是美女，那么在下次遇到这一类型的女生时，大概率也会将她归在美女这一类，这个过程就叫做无监督学习。

无监督学习的训练集使用的无标签的数据，即每一条数据没有正确答案，所以其目标不是告诉计算机怎么做，而是让计算机自己学习怎么做，自己去探索数据并找到数据之间的规律。通常采用相似度计算的方法找到规律训练模型，对于新样本，计算新样本与原样本的相似度后，模型即可按照相似程度进行归类，即我们常说的“物以类聚，人以群分”。

无监督学习常见的应用场景：如用户群体划分、用户画像，通过无监督学习识别有相同属性的用户群，为互联网营销活动提供决策支持。

3、半监督学习

对于有监督学习来说，其前提是需要海量带有标签的训练数据，而在如今数据爆炸的时代，想要给数万亿的数据打上标签是一件工作量非常大的事，所以往往只能拿到少量带标签的数据，这种情况不适合使用有监督学习的方法。

半监督学习就是为了解决该问题，顾名思义，是结合有监督学习和无监督学习的一种学习方法，利用海量未带标签数据，辅之以带标签的数据进行学习训练，增强计算机的学习能力。

4、强化学习

当小孩不好好吃饭时，大人不直接告诉他做错了，纠正他的错误，而是通过比如生气或者处罚等方式给予反馈；当表现的不错乖乖吃饭的时候，大人也不直接正面夸奖做的对，而是通过送小礼物等方式给予激励，经过多次反复“训练”之后，小孩就会知道不好好吃饭是一个不好的行为，这个过程就是强化学习。

强化学习又称为再励学习、评价学习或增强学习，是在没有任何标签的情况下，先尝试做一些动作得到一个结果，通过这个结果的反馈调整之前的行为，通过不断的调整，算法强化自身的决策能力，最终能够通过不同的情况，获得不同的决策能力。

强化学习最经典的应用就是：alphago围棋人工智能程序，针对围棋的复杂性，结合有监督学习和强化学习，训练形成了一个决策网络模型，在2016年3月战胜了世界围棋冠军李世石。

三、小结

本文主要介绍了AI的相关概念以及机器学习的四种方法。机器学习的本质就是让计算机学习人类，通过观察大量的数据发现事物规律，或者甚至比人类更强的分析与解决问题的能力。而四种机器学习方法也各有特点：

有监督学习：依赖带有标签的训练集，找到事物特征与标签之间的映射关系，适合解决分类问题，也是目前相对来说应用最多，最为成熟的机器学习方法。
无监督学习：不需要带有标签的数据作为训练集，通过相似度计算等的方式找到规律，将数据进行整理归纳，适合解决聚类问题。
半监督学习：在带标签的训练数据有限的情况下，结合有监督和无监督学习的方法，增强计算机的学习能力，以提高学习的准确率。
强化学习：预先没有数据，通过与环境交互后给予的反馈调整算法，推导规则，适合解决决策类问题。

这四种机器学习方法并无优劣之分，可根据具体的问题和需求，应用于不同的业务场景。

以上便是本周AI的学习笔记分享，希望接下来能更愉快的与我们的算法工程师沟通，也希望对你有帮助，下期预告：机器学习的基础算法，我们不见不散~

{{userData.name}}已认证

AI学习笔记 | 初识机器学习（一）

一 AI的概念

1、AI的定义

2、AI的价值

3、AI的产品形态

二、机器学习的分类

1、有监督学习

2、无监督学习

3、半监督学习

4、强化学习

三、小结

AI 硬件产品需求文档（PRD）

产品设计师必懂需求分析法：KANO模型