在日常工作中遇到简单的业务问题,可以直接查看数据来进行验证并解决,但遇到复杂的问题时,可能看到数据都无从下手,拿到数据也看不出什么问题。
下面介绍几种常见又比较通用的数据分析方法,希望这些分析方法可成为你进行数据分析和解决业务问题的利器。
在数据分析工作中,你可能经常遇到这一种的问题:从浏览到消费的转化率一直很低,那到底该优化哪里呢?如果你要投放广告该如何抉择对象人群呢?
遇到类似的问题,我们应该将具体的业务问题和数据之间建立一种关系,然后通过一些分析方法和分析工具,让我们在遇到此类问题时知道:我该选择什么样的分析工具或分析方法去解决实际业务中的问题。
俗话说:没有对比就没有伤害。数据分析的最终目的是对现实的情况或一个功能的好坏做评估,这里最常用的方法就是对比分析法啦。 接下来介绍对比分析法中的三个问题:比什么?如何比?跟谁比?
绝对值是本身就具备价值的数字 ,比如:电子商务平台的销售金额、公众号的阅读数等。当然,如果只看绝对值,是无法得知事情严重到什么程度的。
在具体环境中看比例值才具备对比价值,比如:电子商务平台的详情页转化率,复购率等。必须要格外注意的是:比例值是一个除法计算,很容易把数量级的一些数字给忽略了,比如说:85除100和85000除100000得到的都是同样的值。
环比是与当前时间范围相邻的上一个时间范围对比。 以下图为例:如果是日环比,则是拿星期二的数据与星期一的数据比,同理,周环比呢,则是拿本周的数据和上一周的数据对比,那月环比自然也是拿本月的数据与上一个月的数据对比了。
举个栗子:比如说我们要做一个为期10天促销活动,在做这个活动的过程中,天天都会去观察活动的效果,根据前一天的活动效果来优化后面的活动过程,而这个活动之前没有做过,没法与以前的活动效果作对比,这样一个时间段就要看日环比数据了。 环比适用于根据相邻时间范围的数字对当前时间范围的指标进行设定。
比如给我们的产品设定每月新增用户为100000,但是第一月我们只做到10000,第二个月只做到12000,那我们就需要跟据前面两月的真实的情况进行对比,调整第三个月及之后的目标了。
同比是与当前时间范围上层时间范围的前一范围中同样位置数据对比。 举个栗子:今天是4月16日(当前时间范围),月同比就是选择3月16日来同4月16日进行同比计算。
同比的使用场景有:打赏的流水、销售流水等。像旅行、餐饮、骑行这些会受季节性影响的产品,会拿今年的这个日/月或一个时间段跟去年的同期进行比较。
举个栗子:公司每年都会进行“双十一”大促,这个时候我们对比数据时可以把今年的同去年的,或者去年同前年的数据作对比。
同比适用于观察的时间周期里有较多干扰,而我们希望某种程度上消除这些干扰。比如说短视频类的产品,是不是需要考虑工作日和周末以及其他节假日呢。
时间维度:拿昨天跟前天比,拿这个星期跟上个星期比(环比、同比)等等。 不同业务线:跟公司不同的业务线进行对比,比如说做线上汽车交易的,拿新车和二手车比。
往期均值:这里不同于时间维度,像留存、销售额、日活这些都是比较连续的数据,每天都会产生新的指标。但是有很多事情不是连续性的,它不会每天都产生数据,这样一个时间段就要根据往期这些数据的均值进行对比。
在实际的业务中,如果跟自己比找不到原因,那么就需要跟行业比,看是自身的原因,还是行业的趋势导致的跌或者涨。
都跌:如果都跌,咱能不能比同行跌得少? 举个栗子:A公司的跌了10%,咱们公司跌了30%,那么在这个相对竞争的环境中,咱跌的是更多的,通过这样的对比,就能够找到原因并解决这一个问题。
都涨:如果都涨,咱能不能比同行涨得快? 都涨也是一样的道理,如果A公司涨了30%,咱们只涨了10%,也能找到原因,并给出解决方案。因为如果不这样做,那么相对于竞争对手而言,咱还是在跌的。
拓扑数据分析(TDA),顾名思义,就是把拓扑学与数据分析结合的一种分析方法,用于深入研究大数据中潜藏的有价值的关系。相比于主成分分析、聚类分析这些常用的方法,TDA不但可以有效地捕捉高维数据空间的拓扑信息,而且擅长发现一些用传统方法无法发现的小分类。这种方法也因此曾在基因与癌症研究领域大显身手。
|