5000字长文解析:带你解读阿里大数据建设方法论OneData
在建设大数据数据仓库时,首先要进行充分的业务调研和需求分析,这是数据仓库建设的基石,业务调研和需求分析做得是否充分直接决定了数据仓库建设是否成功。其次进行数据总体架构设计,主要是根...
一文掌握OLAP和DataCube数据魔方应用
OLAP( On-Line Analytical Processing),联机分析处理过程。个人理解为主要场景针对大批量数据,实时性无要求,基于数仓多维模型,进行分析操作的系统中。Hadoop体系中MapReduce、Hive、Spark、...
指标与标签的区别
在公司数据建设过程中,经常会使用和提到指标和标签,但是很多小伙伴对于两者的区别确不能讲清楚。实际上标签与指标一样,是理解数据的两种方式,在赋能业务上,两者同样重要。接下来将结合自身...
最全面的数仓分层剖析,一文搞定企业数仓分层
从事数仓相关工作的人员都知道数仓模型设计的首要工作之一就是模型分层,可见模型分层在模型实际过程中的重要性,确实优秀的分层设计是一个数仓项目能否建设成功的核心要素,让数据易理解和高复...
浅谈数仓分层和模型
数仓为空间换时间,通过大量预处理,提升用户数据效率体现等。故而存在大量数据冗余。如果不分层,源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大。通过数据分层管理可以简...