数据分析的一般思维(1)
当我们面对海量数据时,根据不同的业务形态,采用不同的方式对数据进行处理和分析,这都属于战术实施。其实还有一个上层的执行动作是我们需要做的。
这就是数据分析思维的建立。有了一定的分析思维,我们更容易以不变应万变。
具体来说,有三种常见的数据分析思维:
我们在网上购物的时候,看中了一件衣服。如果这件衣服非标,品牌认知度没那么强,我们不妨在淘宝、天猫、JD.COM、拼多多看看...比较价格,对吗?
比如我们去菜市场买菜,阿姨们可能很有经验。即使白菜、洋葱、肉的价格上涨1美分,他们也能很快感知到。
再比如,最近高考刚刚结束。父母非常关心孩子的高考成绩。成绩出来后,孩子们告诉妈妈,我考了550分。妈妈可能马上想到这个分数是几年级的,可以复制吗?你上不了大学,你能上大学吗?
这些我们在生活中非常熟悉的场景,其实大家都在无形中使用了数据的对比,但是因为我们对这些场景的数据太熟悉了,甚至下意识的使用了对比。
对比数据在我们的生活中无处不在。另一方面,如果不对比数据,很多时候这些数据根本没有意义。
比如当有人告诉我们他的年收入是1万。这时候可能有人会“哇”的一声哭出来。一个“哇”表示已经比对了1万的数据。如果你一年赚200万,你可能不会“哇”。你也对比过1万的数据没有一个“哇”。
没有对比,我们不会有任何情绪上的变化,只是知道了那哥们一年赚654.38+0万的事实,因为我们不知道654.38+0万的收入数字到底是多少。
这时候1万的数据就没有意义了。
在就业市场上,有两个常见的问题需要用分解思维来解决:煎饼摊收入的估算和地铁客流量的估算。
煎饼摊收入的估算
如果开一个煎饼摊,可能要先搞清楚怎么算利润。对了,不管是大企业的老总,还是早餐店的老板娘,他们很重要的一个能力就是会算账。如果你不懂会计,我们来做点别的。有一个估算煎饼摊月收入的粗略公式:
根据这个公式,我们来做一个假设。比如我们一天可以卖200套煎饼,每套煎饼5元,那么一天下来,我们一天的销售额就是200 * 5 = 1000元。
这是真实的一天的销售情况,我们可以进一步分解来看每小时的销售情况。我们想一想就会知道:
我们再做一个假设,比如我们每天的工作时间是8: 00-19: 00。那么,在11小时的工作时间里,早上2小时可能生意最好,每小时卖出45套;18:00-19:00期间,生意不错,我们也卖了45套。中间八个小时,生意一般,每小时卖出五套。
于是,就这样,我们一天卖了45 * 3+8 * 5 = 175(套)煎饼。然后假设我们很勤快,365天都在卖煎饼,风雨无阻,这意味着我们每个月都完全在场。那么,如果简单按一个月30天计算,每个月可以卖出175 * 30 = 5250套煎饼。
假设每套煎饼还是5元,那么一个月的销售额就是5250 * 5 = 26250元,那么一个月包括人工、原材料、房租在内的总成本就是9000元,那么一个月的利润就是17250元。
可以细分吗?
当然可以。
如果每个订单都输入到系统中,换句话说,假设我们可以实时监控商店中的每个订单,我们就可以分析5分钟的数据。
如果对这个分析感兴趣,可以自己做一些数据,用excel进行分析。我可以预见,一旦对5分钟数据进行监测分析,分析结论大概就能推断出我们在供货时需要做哪些调整。
地铁交通量预测
需要注意的是,面试时给出这样的题目,目的并不是要求我们精确计算这个城市每天的地铁客流量,因为在实际工作中,谷歌一下子就知道了。面试这样的题目,更关心的是我们的解题思路是否清晰。
假设要计算深圳每天的地铁客流量,可以从供给端入手。如果题目没有明确要求,选择从供给侧入手可以简化问题。
要计算深圳每天的地铁客流量,我们可以想到一个简单的公式:
深圳地铁日交通量=地铁数量*每条地铁搭载人数。
首先,我们对地铁数量进行分解,可以得到:
然后,我们将地铁乘客的数量进行拆分,我们可以得到:
最后,我们可以通过组合分解的公式得到这样一个公式:
我们可以根据自己的经验给每个因素赋值来得到结果。例如,深圳的情况可能是:
值得一提的是,深圳这样的城市上座率几乎都在100%以上,尤其是早高峰时段。相信经历过的人都不想回忆。
数据领域经常需要追溯思维。
我们知道,在处理海量数据时,往往会出现一些数据问题。例如,有一天,我们发现某个指标表现异常。这个时候我们通过简单的思考发现,最近业务上并没有什么动作。为什么数据波动这么大?
这个时候我会下意识的看一下数据细分,看看每个数据产生的整个环节哪里有问题。从我个人的经验来看,大部分的数据问题都可以通过这种方式来寻找问题。
从数据本身来说,详细的数据才是指标的“精髓”。
再举个例子,我们听到马斯克说他过去造了特斯拉。为了解决电池成本高的问题,他还从电池的必备成分铁、镍、铝等方面寻找降低成本的方法,并成功解决了问题。当然,他后来得出结论,他是用物理学第一原理来看待这个问题的。
再比如,王兴用比特(最小的信息单位)来看互联网。...
回过头来看,这些视角和做法都是从事物本质思考的结果。
好了,关于数据分析中常见的三种分析思维就讲到这里吧。