数据可以说是当红“炸子鸡”,当5G和大数据逐渐地融入到各行各业,我们每天都会与各种各样的数据打交道,我们的工作也在不断的产生着各种数据。以往分析数据只是数据分析师(BI)的工作,伴随着信息技术的高速发展,我们日常工作中其实都会接触到大量的数据,但实际BI们更专注于对业务端的数据进行分析,继而为运营工作提供方向。在这个数据纷繁的时代,想把我们日常工作中所产生的数据利用起来,让数据为我们的工作创造价值,还得需要我们自身对数据进行研究。
为什么要做数据分析
腾讯正在着手研发输入法,原因之一就是输入法可以作为一个数据入口,高效率帮助分析用户行为。从优质数据到精准决策的转换,靠的就是数据分析,从海量的数据中,提炼、归纳、总结出某个结论,用来验证决策方向的正确性或者对当下业务情况进行可视化。数据分析的作用和价值,可以总结为识别机会、诊断问题、评估效果、提高效率四个方面,使用适当的分析方法,运用高效的分析工具进行分析,提取其中有价值的信息,概括总结形成有效结论,从杂乱无章的海量数据中,挖掘出数据的最大价值。
完整的数据分析怎么做
一谈到数据分析,我们常常会想到的问题有:
数据分析需要掌握哪些知识?
需要学习哪些工具?
它到底能解决什么问题?
……
简单来看数据分析的核心就是分析数据,一个完整的数据分析过程主要包括下面几个步骤:明确需求—确定思路—处理数据—分析数据—展示数据—撰写报告—效果反馈。而上面我们所说的关于数据分析的专业知识和相关工具等,都是为了辅助这个分析过程的顺利进行。
1.明确需求
数据分析的第一个步骤就是与他人沟通,明确需求内容,这个阶段容易出现反复沟通的问题。为避免这个常见问题,沟通中注意抓核心问题,并且可以尝试适当提出自己的想法,让需求更加立体。为了避免沟通不全或重复,可以从5个方面沟通:目的、主体、口径、思路、完成时间,沟通完毕后,尽量以文档形式记录,便于各方参考。
2.确定思路
分析思路是整个分析过程的“灵魂”,如何快速确定分析问题的思路呢?可以尝试从以下三方面拓展,第一个是套用经典,也就是活用“套路”,比如关于数据分析常常提到的“AARRR分析、RFM分析、5W2H分析”,这些经典的分析方法,可以帮助快速对问题有一个清楚的认知。第二个是利用公司现有的指标体系,目的是根据实际的情况,找到合适的切入角度。第三个是总结提炼,如果公司有历史分析报告,可以借鉴,在对问题现有认知的基础上,不断总结,提炼出自己的分析框架,建议使用思维导图软件,对框架进行呈现。
3.处理数据
当有了一个具体的分析框架,为了让数据呈现的更加清晰,便于从每个维度进行参考,需要对数据进行处理。那用于分析的数据一般是从哪里来呢,主要来源有现有数据库、报表和外部可以通过爬虫、统计网站获得的数据。数据传输过来,不能直接用来分析,因为数据是杂乱无章的,需要加工成适合数据分析的样式,常用样式为一维表。数据加工的主要方式有数据清洗、数据计算、数据转化。
数据清洗:剔除或用合理值代替掉异常值、空值等。
数据计算:通过数学公式计算出需要的其他数值,比如:日均值、总销售额。
数据转化:将数据转化为离散型数据。
4.分析数据
这一步是数据分析的重头戏,按照上面我们总结出的分析框架,应用我们所掌握的分析工具,Excel、SQL、Python、R,对处理好的数据进行分析。常用的分析方法有对比分析、结构分析、分类分析,高级分析方法有聚类分析、回归分析、决策树分析等。
5.展示数据
展示数据也就是我们说的数据可视化,俗话说“文不如表,表不如图”,所以在展示的时候,我们常用图表展示,如柱状图、条形图、饼图等,专业的展示工具有Power BI、Tableau。
6.撰写报告
常用的报告形式有PPT、WORD、Excel,内部的交流报告,常选择Excel,大型汇报一般选择美观度更高的PPT,在撰写报告的时候,要注明分析目标、分析口径、数据来源,需体现有价值的结论和建议。图文并茂、逻辑性强的报告,让阅读的人能够跟着你的一条分析思路走到分析结果。
7.效果反馈
所谓效果反馈就是根据恰当且具有代表性的指标,及时监控策略的执行进度。“有输入,有输出”才能知道自己的操作问题,所以效果反馈是很有必要性的。目前常用的反馈形式有两种:监控报表、分析报告。监控报表常用于日报、周报,分析报告常用于月报和年报等周期性较长的效果反馈汇报。
实用的数据分析思维
逻辑论证的三要素分为:论点、论据、论证。借助逻辑思维,能够确立正确的执行方向,减少执行过程中出现的误差,在训练逻辑思维时,要注意保证信息的完整度,否则后续的论证是没有意义的。在进行数据分析时,常用的4种思维方式以及运用方法有如下四种,分别是:目标思维、结构化思维、推理思维。
1.目标思维
目标即三要素中的论点,判断论点是否有效,需要细究其论据和论证方式。在陈述问题时,常常采用KWIC法,全面的呈现出现有信息,提升后续论证质量。
2.结构化思维
结构化思维能够帮我们将杂乱无章的信息,进行归纳、分类。
(1)问题树
问题树也就是我们常说的“脑图”。其运用主要有两种方式,一种是通过最终的目标进行拆解;另一种是将信息完全罗列,并对其进行归类逐层向上聚合。
(2)公式法
公式法不太关注细分场景以及整体漏斗,在分析时,结合场景、操作流程,对公式进行细化。比如我们研究一个APP的注册人数时,注册人数=手机号注册人数+微信注册人数,手机号注册人数和微信注册人数,又可以转化为进入页面人数和跳失率等指标,在运用公式法时要注意完全穷举各种指标,根据具体哪个数据跟我们的预期有出入,来进行优化。
3.推理思维
推理思维主要使用的方法是归纳、演绎、因果分析法。
(1)归纳法
归纳法,是指从特殊到一般的过程,所以这个方法不能保证准确度,在使用该方法时,要增加衡量维度,如样本数量、样本占比等。样本量太小会容易导致其代表性不足,容易出现错误的结论。
(2)演绎法
演绎法和归纳法相反,常见的表现形式是逻辑三段论,具体为:大前提、小前提、结论。假设大前提是真的,小前提也是真的,那么结论也是真的,演绎法追求的是不自相矛盾。
(3)因果分析法
使用因果分析法,应先对结果进行假设,并通过实现或者其他的验证手段进行验证,最终的验证结果才是真正的结论。
总结
在当下这个“数据时代”,用数据说话,也靠数据竞争。数据分析是门复杂的学科,需要不停的探索,所谓“技多不压身”,除了分析的结果所创造的价值,分析的过程也是对工作的一个梳理,和对逻辑思维的锻炼,多做一些,很可能打开新世界的大门。