扫一扫
关注微信公众号

数据分析的五个步骤
2022-03-10    大数据科学头条号

  一、概念

  什么是数据分析呢?数据分析是指基于商业理论,依赖统计工具,洞悉数据背后的规律,从而为企业创造最大价值。其主要运用在:监控异常的数据、建立模型并预测、关键变量分析并预测、预测性分析。

  二、数据分析得五个步骤

  1、数据收集

  当我们进行数据分析时,首先解决的问题就是数据源的问题。分为两大类。

  第一类:直接能够获取的数据,也就是内部数据。

  第二类:外部数据,经加工整理后获得数据。

  2、数据清理

  清洗数据的目的也就是从大量的、杂乱无章的数据中抽取以及推导出对解决问题有价值的、有意义的数据。清洗后保留下来的真正有价值、有条理的数据,为后面的数据分析减少分析障碍。

  3、数据对比

  对比也就是数据分析的切入口。因为如果没有参照物的话,数据也就没有一个定量的评估标准。通常情况下,我们会进行横向对比和纵向对比。横向对比,与行业平均数据,和竞争对手数据比较,纵向对比,是与自己家产品的历史数据比较,围绕着时间轴比较。

  4、数据细分

  数据对比出现了异常后,我们该怎么办呢?这时候就需要用到数据细分了,数据细分通常情况下先分纬度,再分粒度。纬度也就是时间或者是地域、来源、受访等。粒度也就是按照天、还是按照小时。

  而纬度结合粒度进行细分,就可以将对比的差异值逐级锁定问题区域,就可以更为容易找出发生问题的原因了。

  5、数据溯源

  通过数据细分基本上我们就可以分析出大多数问题的原因,但也会遇到特殊的情况,因此这时候我们就需要进行进一步的分析,也就是通过数据溯源就能找出问题的原因。依据锁定的这个纬度和粒度作为搜索条件,查询所涉及的原日志,源记录,然后基于此分析和反思用户的行为,往往会有不一样的发现。又或者结合用户使用场景去思考。

  

热词搜索:

上一篇:当前大数据技术的基础是由谁首先提出的?
下一篇:大数据对人力资源绩效管理产生的积极影响

分享到: 收藏