AI学习笔记 | 初识机器学习(一)

从去年开始就有参与公司的AI项目,这个参与过程主要是偏执行,即按照要求实现产品某部分功能的需求即可,很少思考各个环节背后的原因是什么,如何权衡如何做决策,当然,当时的积累也不足以支撑我给意见,更不用说是做决策了。现在成为另一个AI项目负责人之后,AI方案、资源协调、风险管理、成本投入等等所有的事都需要自己去思考、权衡、沟通、解决。

AI学习笔记 | 初识机器学习(一)

与普通的产品和项目不同的是,AI是产品的核心,所以算法工程师是我最常沟通的对象,必须要理解他们的语言。为了能更顺畅的与算法工程师沟通,把控项目质量与风险,特意买了两本书,开始恶补AI知识,以下是本周的学习成果,分为两部分:AI的概念和机器学习分类。

一 AI的概念

1、AI的定义

AI(Artificial Intelligence) 人工智能,目前已经成为计算机科学领域的一个重要分支,即让计算机也像人类一样学习,通过观察和训练,发现事物规律,从而获得分析问题、解决问题的能力,甚至能超越人的思维和判断力,我们把计算机学习的方法叫做机器学习,机器学习的结果叫做模型。

2、AI的价值

其实人类绝大多数对事情的认知是基于概率,比如医生诊断病人,根据病人的症状再结合理论知识以及多年的经验,会得出一个大概率的判断,人工智能的本质就是实现推断的概率可以无限逼近100%,最终代替人做判断,节省人力成本,以及帮助解决一些人类未知的问题。

3、AI的产品形态

AI的产品形态类似一个“中间件”,不直接与用户完成交互,需要借助传统的应用程序,应用程序直接与用户进行交互,同时提交输入数据给模型,模型处理后返回输出数据给应用程序,应用程序再转化为合适的呈现方式反馈给用户。

二、机器学习的分类

1、有监督学习

在大人教导小孩认识事物时,比如认识一只大熊猫,大人一般会对着熊猫的照片这么教导:你看,大熊猫的体型很大,头圆圆的,有黑白相间的毛,喜欢吃竹子…,当小孩听多了或者见多了的时候,脑子里慢慢的会形成一种直观感觉,并记住熊猫的特征,让下次再遇到大熊猫时,不需要大人告诉,自己也能认识,这个过程其实就是有监督学习。

有监督学习要求训练集的每一条数据都是带有特征和标签(答案)的,通过学习、分析训练样本的特征和标签之间的关系,得到训练模型,再利用模型将新的输入数据映射为相应的输出,对输出进行判断从而实现分类。

有监督学习算法最常见的应用场景或领域:如语音、文字、图像识别等。基于海量带有标签的样本库训练模型,并落地产品化,如语音助手、人脸识别等产品。

2、无监督学习

在小孩长大成年后,对于世界的认知不再局限于其他人的教导和答案,而是在看了大千世界之后,形成了自己的标准答案,比如关于审美标准:他就认为短发、小个子的女生就是美女,那么在下次遇到这一类型的女生时,大概率也会将她归在美女这一类,这个过程就叫做无监督学习。

无监督学习的训练集使用的无标签的数据,即每一条数据没有正确答案,所以其目标不是告诉计算机怎么做,而是让计算机自己学习怎么做,自己去探索数据并找到数据之间的规律。通常采用相似度计算的方法找到规律训练模型,对于新样本,计算新样本与原样本的相似度后,模型即可按照相似程度进行归类,即我们常说的“物以类聚,人以群分”。

无监督学习常见的应用场景:如用户群体划分、用户画像,通过无监督学习识别有相同属性的用户群,为互联网营销活动提供决策支持。

3、半监督学习

对于有监督学习来说,其前提是需要海量带有标签的训练数据,而在如今数据爆炸的时代,想要给数万亿的数据打上标签是一件工作量非常大的事,所以往往只能拿到少量带标签的数据,这种情况不适合使用有监督学习的方法。

半监督学习就是为了解决该问题,顾名思义,是结合有监督学习和无监督学习的一种学习方法,利用海量未带标签数据,辅之以带标签的数据进行学习训练,增强计算机的学习能力。

4、强化学习

当小孩不好好吃饭时,大人不直接告诉他做错了,纠正他的错误,而是通过比如生气或者处罚等方式给予反馈;当表现的不错乖乖吃饭的时候,大人也不直接正面夸奖做的对,而是通过送小礼物等方式给予激励,经过多次反复“训练”之后,小孩就会知道不好好吃饭是一个不好的行为,这个过程就是强化学习。

强化学习又称为再励学习、评价学习或增强学习,是在没有任何标签的情况下,先尝试做一些动作得到一个结果,通过这个结果的反馈调整之前的行为,通过不断的调整,算法强化自身的决策能力,最终能够通过不同的情况,获得不同的决策能力。

强化学习最经典的应用就是:alphago围棋人工智能程序,针对围棋的复杂性,结合有监督学习和强化学习,训练形成了一个决策网络模型,在2016年3月战胜了世界围棋冠军李世石。

三、小结

本文主要介绍了AI的相关概念以及机器学习的四种方法。机器学习的本质就是让计算机学习人类,通过观察大量的数据发现事物规律,或者甚至比人类更强的分析与解决问题的能力。而四种机器学习方法也各有特点:

  1. 有监督学习:依赖带有标签的训练集,找到事物特征与标签之间的映射关系,适合解决分类问题,也是目前相对来说应用最多,最为成熟的机器学习方法。
  2. 无监督学习:不需要带有标签的数据作为训练集,通过相似度计算等的方式找到规律,将数据进行整理归纳,适合解决聚类问题。
  3. 半监督学习:在带标签的训练数据有限的情况下,结合有监督和无监督学习的方法,增强计算机的学习能力,以提高学习的准确率。
  4. 强化学习:预先没有数据,通过与环境交互后给予的反馈调整算法,推导规则,适合解决决策类问题。

这四种机器学习方法并无优劣之分,可根据具体的问题和需求,应用于不同的业务场景。

以上便是本周AI的学习笔记分享,希望接下来能更愉快的与我们的算法工程师沟通,也希望对你有帮助,下期预告:机器学习的基础算法,我们不见不散~

业界动态

AI 硬件产品需求文档(PRD)

2019-12-16 9:31:02

业界动态

产品设计师必懂需求分析法:KANO模型

2019-12-16 10:42:26

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索