数据分析思维:预测分析

数据分析师到底是干什么的?我相信不仅是想入门的小伙伴,已经入行很久的数据分析师可能多多少少还是会有些不清楚。数据分析师是每天被各个业务方呼来唤去的提数工具人么?还是被各种不靠谱的可视化软件蹂躏的报表maker?还是好不容易做了个专题分析,却被业务方嫌弃不说“人话”的,只会纸上谈兵、指手画脚的外行?

数据分析思维:预测分析

我相信每个数据分析师都会多多少少经历以上的心路历程,直到某天突然明白数据分析的终极奥义,才能跳出这个让人迷茫的怪圈。原来数据分析是要:熟悉业务,在此基础上基于对业务的理解发现业务上的问题,然后提出分析的方案,然后再是用工具提数分析,最后给出结论和建议,并推动相关方实施落地,进而解决问题,完成从业务中发现问题,再回到业务中解决问题的完整闭环。这才是数据分析的真正意义。

明白了这些,你可能就会发现,区别于其他的开发类工作,数据分析是以业务、思维为主、工具为辅的工作,重要的不是你会多么高端牛逼的工具和算法,而是你怎么发现问题,怎么形成分析思路,这才是数据分析师拉开差距的关键所在,至于剩下的就是怎么具体实施,这个,找个实习生也能做,哪部分工作含金量更高、被取代难度更大,一目了然了吧?

这也是我写【数据分析思维】系列文章的原因,数据分析本身就是业务和思维为重,授人以鱼不如授人以渔,清晰完备的思维可以让你事半功倍,知道怎么做远比实际做要重要的多,代码未动,思维先行,懂得运筹帷幄才能走得更远。

01、为什么预测很重要?

每逢年末年初,除了对上一年的整体业绩做复盘和总结外,老板最关心的一件事莫过于:“下一年的销售额预测是多少?” 这个问题看似很简单,但却让下属主管们挠秃了头,因为这个预测不是拍拍脑袋就敲定,说高了,顺势就给自己挖了个坑,说低了,老板就会diss你没有了解业务现状。

其实不仅仅是销量,在各行业各领域,只要有核心的业务指标,都要预测核心业绩未来的走势,销售,市场营销,运营,财务等,一方面可以对未来的发展趋势有个大致的掌握,另一方面也可以提前规划,设定各下属部门的KPI,以便尽可能地完成或者超过KPI,所以,数据分析师作为公司业务的策略官,掌握正确的预测方法,无疑是非常重要的。

可是预测到底该怎么做呢?看到那么复杂的数据,肯定要用很高端的工具才可以吧?Python还是SPSS呢?我都不会啊啊!!!

其实我们可以用Excel,是的,没有听错,就用我们平时觉得很low的Excel就能完成那么高大上的操作,无需任何统计和编程知识,简单妥妥拽拽,预测就完成了,下面我们就以一个实际案例开始我们的Excel的预测之旅吧!

在本文中,我们将对一家老牌的甜品店进行非常有趣的案例研究。我们有以往年月的销售量数据,将预测2020年剩余月份的销售量。

正如在前面所提到的,预测是数据分析师最基本的技术之一,可以帮助公司预测未来的业绩趋势和机会。大型公司和初创公司都会依赖预测来做出关键的决定。例如:

  • 使用预测来预测产品、服务的用户量,并在合适的时间点进行运营
  • 使用预测来预测销售并相应地计划预算,制定KPI等
  • 使用预测来预测人力成本,并因此建议未来的招聘计划
  • 其他

这些是数据分析师在实际工作中会经常遇到的预测案例。如果你打算成为一名数据分析师,一定要学会预测分析。

02、什么是预测?

什么是预测?

用最简单的术语来说,它是在分析过去和现在的数据,进而预测未来的过程。我们主要根据时间序列数据进行定量预测。因此,在开始之前,我们先了解一些关键的时间序列术语。

时间序列通常是随时间推移而收集的数据,并且取决于时间变量。例如,这里有一个每年飞行的乘客数量的时间序列数据:

数据分析思维:预测分析

时间序列数据中包含了一些重要的组成部分,我们需要将这些组成部分拆解:

趋势性:趋势是事物发展或变化的总体方向。在上面的例子中,我们看到时间序列呈增长趋势,这意味着在飞机上飞行的乘客数量整体趋势上是在增加。如下图中第二张图所示。

季节性:在上述时间序列中可以看到的另一个清晰的模式,就是该模式以固定的时间周期重复,我们称为季节性。在特定时间周期内重复出现或重复的时间序列中任何可预测的变化或模式都可以说是季节性。下图中第三张图所示。

随机性:去除趋势性和季节性后,剩下的就是一些随机的、无任何规律的白噪声。下图中第四张图所示。

数据分析思维:预测分析

03、用Excel内置函数进行预测

内置函数介绍

我们将从Excel中可用的最简单的函数开始:

Forecast.linear()

它通过使用现有或过去的值来预测或计算值。我们将通过自变量x值来预测y,是基于线性回归函数进行预测。

如果数据中存在线性趋势(即y线性依赖于x值),则此函数的效果最佳,但有一点需要注意,如果数据中存在明显的季节性,那么该函数就不再适用了。

那么对于有季节性的数据,我们该怎么预测呢?不用担心,Excel为我们提供了另一个强大的高级预测功能:

Forecast.ets()

此函数通过三重指数平滑方法进行此预测。这里不会深入介绍指数平滑方法,但该函数的使用需要注意一些点:

  • Forecast.ets函数或三重指数平滑方法考虑了季节性
  • 此方法是加权方法,越久远的值,权重越小,也就意味着,重要性越小
  • 最重要的是,时间轴必须均匀分布,否则会产生错误。例如,它们可以是每月数据,每日数据,年度数据等。

Forecasting.ets.seasonality()

它返回基于历史数据检测到的季节性周期的长度,如有的数据是5个月重复一次,那么它的周期就是5。

Forecasting.ets.confint()

它返回指定目标日期的预测值的置信区间。默认的置信区间为95%。这意味着95%的预测值将在该值的范围内。

单纯的理解这些函数可能有些费力,所以我们从一个实际案例看看怎么一步步跑起来。

使用内置函数预测

下面就是本文中最令人期待的部分了。我们有一个甜点店的数据集,它包含从2018年1月到2020年8月的每月销售数据。我们将预测在2020年剩余月份的销售情况,以便店主可以相应地准备库存和工作人员。

这是示例数据:

数据分析思维:预测分析

我们将预测4个月的销售额:9月,10月,11月,12月

数据分析思维:预测分析

需要注意的是,使用的Excel版本必须是2016以后的版本。

基于Forecast.ets函数进行预测:

数据分析思维:预测分析

同时,也可以使用Forecasting.ets.seasonality和Forecasting.ets.confint检查季节性和置信区间。

04、用Excel预测模型进行预测

在Excel 2016及更高版本中进行预测可以更加直观和方便。我们可以直接使用预测模型执行这些步骤。

步骤1:选择预测表

转到数据,然后选择预测表:

数据分析思维:预测分析

步骤2:选择必要的选项

然后,您可以选择必要的选项,例如:结束日期,置信区间,并执行更多自定义。预测表为我们提供了表格值,例如预测,下置信度值和上置信度值以及数据的图形视图:

数据分析思维:预测分析

拖拖拽拽,连函数都不用输入,你已经在Excel中建立了第一个预测模型!很简单,是不是?

数据分析思维:预测分析

我们来看一下我们的预测结果:

数据分析思维:预测分析

通过查看我们的数据,我们注意到通常在十一月和附近月份会出现高峰,这可能是由于节日的原因。

受新冠疫情的影响,到4月和5月,这家商店的收益为零!太难了!在接下来的7月和8月,销售量有所回升。

我们的预测表明,这种趋势将在9月份继续增长。现在,商店可以查看未来几个月的预测数据以准备库存。他们还可以查看置信度,并了解波动的情况。

05、结尾

预测很复杂,因为预测涉及到很多业务。预测又很重要,因为它关乎后续业绩的发展和政策的制定,同时,预测也很简单,简单到用Excel拖拉拽就能轻易实现。本文介绍了用Excel进行预测分析的具体方法,希望这种简单易操作的方法能够帮助到大家。

以上就是数据分析思维—预测分析部分的内容,部分数据分析思维请翻看历史文章,更多数据分析思维的文章持续更新中,敬请期待,如果觉得不错,也欢迎分享、点赞和点在看哈~

业界动态

「原理」需求攻略:需求的分类与拆解

2021-4-28 16:04:58

业界动态

我教雷军造汽车

2021-4-28 16:25:36

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索