数据分析就是分析数据,那么怎么分析,分析什么呢?显然这个答案没有回答实际的问题。这篇文章是工作中总结自己的痛点、核心指标体系、分析方法论等,然后提出相应的产品需求,解放自己的人力,让自己有精力往更上层走~
数据分析师离不开要和数据产品打交道,一般数据底层建设比较好的互联网公司都会有以下数据产品:
- 数据仓库(包含数据字典等元数据管理)
- BI报表平台
- 埋点平台
- 数据开发平台(DP-用来执行脚本、SQL、工作流、开发任务等)
- 流量平台(路径图、流量归因图等等)
- AB测试平台
- DMP平台
- 其他一些算法平台等
一般这些平台配有数据产品经理、数据开发工程师。所以通常分析师需要和他们的数据产品经理、开发工程师进行沟通。
中台如果没有和业务方有着比较好的交流机制,可能造成数据中台通常距离业务比较远,技术团队不知如何拿数据为业务服务。而有时候产出在业务方那里没有得到很好的使用,比如开发同学开发的BI看板业务方根本不怎么使用,这样同时造成了资源的浪费以及中台同学的价值感较弱。
而数据分析师的价值,目前大多数公司给的定位,也是体现在直接服务了业务什么价值,所以可能也不会在数据产品上分配较多人力精力。
从整个公司角度而言,是需要提高内部数据的整体使用率和效率。这其中需要这些产品的重度使用者、了解业务方向的分析师最好可以和数据中台团队有着更好的沟通机制。至于如何分配成果,是另一件事了(可以聊下你们公司数据开发和外部是什么样的沟通机制吗?)
整个社会的发展方向是效率越来越高,不可逆转,即使中途担心失业问题先保留,也改变不了整个社会运转越来越快的趋势。
一个公司也是如此,要想跟上市场的运转,也需要内部效率越来越高。
如何提升一个团队的效率?其中一个方法可能是标准化、产品化(固化)。
分析师在工作中总结自己的痛点、核心指标体系、分析方法论等,然后提出相应的产品需求(或者搭建一个开源的产品),解放自己的人力,让自己有精力往更上层走。在日常工作中,需要思考,这个可以标准化吗?可以产品化吗?需要整合到一起去吗?
以下是一些术,有道无术尚可学~(限于本人学识有限,希望朋友们新增更多场景)
1、数据仓库需求
常见的数仓需求是增加字段制作宽表、新增业务整合进中间层或者新增中间层、字段字典说明、数据跨域整合、数据质量系统校验
一般要求是好用、质量高、数据全
-
- 大多数人都常用的字段如果不在表中,每次都需要自己加工,提需求给产品/开发同学
- 有歧义、逻辑复杂的字段,经常需要咨询开发同学的,请让开发同学加入字典中
- 业务方有比较多这些指标方面的临时需求的,请抽象整合指标,让开发同学整合到一张报表中或者分析师同学自己做成自助取数
- 重点的新增业务要上线,请提前和产品同学沟通,定好数据指标体系,写好逻辑,让数据开发同学提前开发好逻辑、开发好中间层
- 需要整体来看的业务,数据跨域整合到一起,提交跨业务项目需求,比如业务数据和财务数据的打通、 跨集团跨事业部的数据整合
- 有着严格限制的数据范围等数据质量要求的数据,让数据开发同学做好数据质量校验和日常报警
2、BI报表平台
常用的或者关键的,可以做成图表性质的,均可考虑BI报表化。
一般要求是:目录清晰、图表易懂、数据质量高。
这个是许多业务方、数据分析师使用最多的数据产品,如果业务使用频次高,对业务有直接的反馈,那么价值相对数据仓库容易体现。
难点在于如何设计架构(或者说目录),曾经看到一个BI产品目录,因为图表是每个人可以放置,没有集中管理或者指引,所以我很难找到自己关心的指标和业务在哪里
-
- 连接业务方和数据产品,设计好指标体系、解释好指标的逻辑,满足的是业务方看常规数据的需求
- 业务核心指标(KPI)展示,一般是分析师给老板制作的看板
- 关键业务流程和核心指标
- 周报、月报、年报数据
- 经过前期分享,分析师有价值的报告沉淀:分析师沉淀的自己分析过程中的分解维度和指标看板
- AB测试
3、埋点平台
常见需求是埋点可测试,埋点规范字段可查询,质量监控。
曾经我们是用EXCEL来记录埋点的,管理非常困难。现在一般都有平台。
-
- 提供测试埋点的工具(有些没有加密的都可以使用外部工具)
- 提供埋点的字段含义、参数含义、上下线版本和时间等元数据
- 埋点上线后的质量监控
- 提供输入一个账户后的路径
4、数据开发需求
这个分析师的需求一般少一些,数据开发同学的需求更多
-
- 引擎能更快一些,预测更准一些(是不是大家经常跑个1小时、2小时,结果还挂了)
- 能自动发送邮件,带EXCEL附件(最初我们是python来发送,后来改成了数据平台)
- 支持自主取数,将一些经常性的临时需求,给业务同学自己提取
- 报警机制,分析师的中间层一般不太报警,没有商家或者APP使用的恐慌(还记得以前的半夜炸弹电话)
5、流量平台
PV、UV,这个非互联网人也熟知的指标,通常都会在这里得到答案。市面上大家经常看的是神策、growingIO的工具,都相差不太多。
-
- 页面路径图,能够区分人群、时间、版本等维度
- 行为路径图,能够区分行为类别、人群、页面、时间、版本等维度
- 流量跟踪和流量归因
- 某个事件的PV、UV,区分时间、版本等
6、AB测试平台
分析师也经常用来做发版实验、改版实验,有些公司有许多增长实验,算法实验都在上面
-
- 流量正交和互斥
- 流量监督和报警
- AB实验样本量测算工具、显著性校验工具
- AB实验结果衡量
以下一些问题,希望有经验的朋友提出更多的想法~
- 如何和数据产品共建形成良好的互动机制?
- 如何利用数据产品,来提高业务的运转效率和洞察力?
- 具有远见,知道业务的重点方向和接下来的重点数据产品是什么,给出来自己的见解和需求的优先级别,让数据技术团队可以更好的分配资源?
或许是工作中需要系统性思考的一部分~