这篇文章主要是学习数据分析的入门篇,介绍了什么是数据分析,数据分析的5个步骤,包括明确目的、数据收集、数据处理、数据分析和挖掘、数据报告,希望能对入门的同学有用,接下来我将继续这个系列的文章,大家可以跟我一起学习这方面的东西。
一、什么是数据分析?
数据分析的定义:
- 底层的粗糙数据,经过加工处理,然后将处理产生的相关信息与实际业务相结合,进行规律总结形成知识(解决方案或商业预测)
在没有数据分析的情况下,我们做出判断事情是定性的判断,往往会掺杂很多不可控的主观因素。
有了数据分析,我们利用客观的数据,可以得到更加客观的结论,即定量判断。
所以,在生产经营中,要尽量使用数据来为决策提供定量支持。
当然数据分析的前提是要有客观的数据来源,如果数据来源本身就不客观、不真实,那么数据分析得出的结论也必然是有问题的。这个时候只能用其他方法定性判断。
二、数据分析步骤
2.1 明确目的
明确目的,就是要明确:针对什么产品的什么数据在什么场景下解决什么问题。
举几个例子:
1、某电商APP上线后,注册量很高,但是用户留存率不足1%,请通过数据查明问题
- 产品:某电商APP
- 数据:用户留存率相关数据,可以对留存率这个指标进行指标拆解,找到所有与之相关的过程指标
- 场景:新APP上线后,大量新用户注册
- 问题:新用户留存率低的原因和解决方案。
注意:这里找到问题一定要给出解决方案,只提问题不提解决方案就是耍流氓。
2、撰写本月某社交APP的运营月报
- 产品:某社交APP
- 数据:运营数据,即所有和运营相关的数据指标,由产品的运营数据指标体系决定,侧重分析产品现阶段运营目标指标的相关数据
- 场景:月度总结,问题:分析本月运营的效果和可能存在的问题,并给出下个月的运营方案。
2.2 数据收集
线上收集:
- 后台数据埋点,一般用于收集自己的产品数据
- 爬虫技术爬取网页或APP,一般用于收集人家的产品数据
- 企业自身的业务数据电子化,直接存入数据库以供使用
- 第三方数据平台提供的数据接口
线下收集:
- 线下市场调查问卷
- 一些纸质出版物上的权威数据等
内部收集:
- 企业自己产生的数据,例如企业内部数据库、日常财务数据、销售业务数据、客户投诉数据、运营活动数据等
外部收集:
- 通过某些手段从外部获取的数据,例如利用爬虫技术获取的网页/APP数据、公开出版物收集的权威数据、市场调研获取的数据以及第三方平台提供的数据。
2.3 数据处理
原始数据可能会存在错误,也可能是过于复杂无序,所以需要数据处理。
数据处理包括:
前期处理:
- 脏数据清洗
- 缺失值填充
- 数据分组转换
- 数据排序筛选
后期处理:
- 业务指标计算
- 报表模板填充
数据处理工具:Excel、数据库软件、Python、R、SAS、SPSS
2.4 数据分析与数据挖掘
基于处理好的数据,对其分析和挖掘,结合实际业务得出相关决策,提供给管理层进行决策。
数据分析侧重业务角度,数据挖掘侧重技术角度(基于模型和算法对复杂的大量数据进行处理)
数据分析一定是基于业务的,脱离业务的分析都是耍流氓。基于业务,其实是要求我们分析人员要对全业务流程有个清晰的认识,最好是深刻的理解。
理解业务:
- 产品定位、商业模式
- 产品有哪些功能,解决了哪些用户在哪些场景下的哪些需求
- 产品的业务流程(路径),流程中的核心触点(用户注意力停留的地方)
- 产品现阶段的运营目标,以及运营指标体系,以及各指标数据的近期走势和历史趋势
- 等等你能所想到的所有内容,你对产品对业务了解越深刻,你的分析就越深刻
数据分析策略(四个层次):
著名的咨询公司Gartner于2013年总结、归纳、提炼出一套数据分析的框架,把数据分析分为了四个层次,分别是:
(1)描述性分析(Descriptive Analysis)-解决发生了什么?
- 该层次主要是对已经发生的事实用数据做出准确的描述,这也是许多企业需求最多、最杂的统计工作。比如某企业本月订单签约额比上月增加100万,至1100万。
(2)诊断性分析(Diagnostic Analysis)-解决为什么会发生?
- 知道到底发生了什么,对我们的帮助不大,更重要的是,我们要明白为什么发生。比如经过分析,发现订单履约率下降的原因是成品生产不出来,无法完成交付。而成品生成不出来的原因则是部分原材料的供应商未能按时送货,导致原材料不齐套,无法开始生产。
- 到这一个层次就开始脱离的打杂,成为了辅助经营的角色。
(3)预测性分析(Predictive Analysis)-解决什么可能会发生?
- 通过寻找相关特征和运行逻辑规律,借助定量和定性的分析,实现预测。不仅能找到问题发生原因和解决办法,还能防患于未然,提前调整发展方向,这是辅助经营的更高一个层次。
(4)处方性分析(Prescriptive Analysis)-解决该做些什么
有了预测性分析的结果后,连未来怎样做都准备好了,这已经上升到了战略层面,引领了业务发展。这是数据分析的最高层次,以领导的视角参与的企业决策,成为企业不可获取的角色。
常用的数据分析方法:
- 对比分析法:例如不同产品的同类指标对比,同一产品的同一指标的按时间维度同比或环比。
- 分组分析法:按数据的某个维度将数据分组进行分析,即聚类分析。
- 预测分析法:一种是定性的预测,根据当前数据走势判断未来的数据升降大势,一种是定量的方法,用曲线拟合的方法去计算一条拟合当前所有离散数据的曲线,得出未来的走势
- 漏斗分析法:这个实际上是按业务流程(产品流程)将业务拆解成一个一个步骤(用户路径),然后考察每一步中的指标数据(主要是各个步骤的转化率),举例:
因为每一步都有一定转化率,数据肯定是逐步递减的,就像是漏斗一样,因此称为漏斗分析法。
- A/B test分析法:其实就是对比法的延伸——对比试验,通过控制变量的方法做试验,看所控制的变量对最终结果的影响。
- 树形拆解法:对多因素的数据,用公式拆解的方法,拆分成更细颗粒度的过程指标,因为是公式拆解,所以可以公式化表达。
数据挖掘:
数据挖掘侧重对于一些复杂的大量数据,通过模型或算法对数据进行处理,得到有用信息,这个过程就像是在山里挖矿,顾名思义——数据挖掘。
数据挖掘的规范化步骤可以采用SIG组织在2000年推出的CRISP-DM模型,该模型将数据挖掘项目的生存周期定义为六个阶段:
2.5 制作数据报告
数据分析报告:根据分析目的,进行数据分析,来反映某项事物的现状与问题,分析研究原因、本质和规律,并得出结论、提出问题解决方案的一种呈现应用文体
关键点:
- 一定要明确分析目的,不要南辕北辙
- 围绕分析目的,进行猜测假设,根据业务逻辑和实际信息,确定假设优先级,依次收集数据去分析验证假设正确性
- 一定要得出结论、提出解决方案
数据分析报告的类型:
基础数据报告:如日报、周报
- 列明重点关注的数据指标
- 对波动异常的数据,注明原因
- 对近期关注的重点动作注明进展
综合性分析报告:如月报/季报,竞争对手分析报告
- 通过对比长时间数据的同比和环比,分析数据波动的原因,找到业务的问题和机会点
- 注明目前重点项目的进展以及问题情况
- 总结成败得失,给出意见和建议
专题性分析报告:如活动复盘、用户分析报告等
- 针对某个专题活动或目的进行细化的分析
- 总结项目的成败原因,得出经验教训
数据分析报告的基本要求:
- 分析背景和目的清晰
- 取数时间和逻辑标记清晰,外部数据注明出处
- 避免结论和数据互相矛盾
- 观点、结论清晰,并且结论一定基于报表中已呈现的数据,有理有据,避免主观臆测
- 呈现方式:文不如表,表不如图,文字和配色尽量简洁
数据分析报告的思路和结构:
金字塔思维:结论一定要写在前面,先给结论,再给分析
总分总结构:第一个总要给出背景、目的、思路和主要结论,然后分开论述,最后总结并给出建议(解决方案)
报告的呈现形式:
- 当然是PPT,除非是那种长篇巨制的专题报告会写成文档,否则用PPT是最好的。
要避免的问题:
- 每一页PPT上都要有观点,不可以没有观点
- 观点一定要提炼,不能啰嗦,也不能太简单说不明白事
- 内容、数据一定是要论证支持观点的,不要脱节
文字提炼原则:
要言之有物
- 删除不重要的话
- 删除不表达观点的描述性语言
要写简单完整句
- 例如:“8月份的销售”,这个句子够简单,但是不完整,而是要写清楚销售怎么了:“8月份的销售完成了计划的120%”