作者博客公众号 dabaispace
欢迎关注微信公众号:
白程序员的自习室
5000字长文解析:带你解读阿里大数据建设方法论OneData

5000字长文解析:带你解读阿里大数据建设方法论OneData

在建设大数据数据仓库时,首先要进行充分的业务调研和需求分析,这是数据仓库建设的基石,业务调研和需求分析做得是否充分直接决定了数据仓库建设是否成功。其次进行数据总体架构设计,主要是根据数据域对数据进行划分;按照维度建模理论,构建总线矩阵、抽象出业务过程和维度。再次,对报表需求进行抽象整理出相关指标体系,使用OneData工具完成指标规范定义和模型设计。

一文搞懂Hive存储格式及压缩格式,太清晰了!
90后程序员职场报告:月薪普遍过万 超七成有房有车 女性程序员不足一成

90后程序员职场报告:月薪普遍过万 超七成有房有车 女性程序员不足一成

您知道吗程序员群体已经高达200万,学历和收入双高,月薪普遍过万;社交圈子相对单一,能够忍受孤独寂寞;理性的消费者,崇尚技术实力。他人眼中的程序员黑眼圈、青年肥、胡子拉碴、枯燥乏味,他们眼中的自己自信、强大、自制力强,乐观开朗。

最全面的数仓分层剖析,一文搞定企业数仓分层
都说数仓是面向主题建设的,那数仓的主题和主题域又应该怎么划分呢?

都说数仓是面向主题建设的,那数仓的主题和主题域又应该怎么划分呢?

数仓在建设过程中,对数据的组织管理上,不仅仅要进行横向的分层,也需要根据业务情况进行纵向的主题域划分。为保证整个数仓体系的生命力,数据域需要抽象提炼,长期维护及更新,但不要轻易变动,在划分数据域时,既能涵盖当前所有的业务需求,又能在新业务接入时无影响的包含进已有的数据域中或者扩展新的数据域。

一文掌握OLAP和DataCube数据魔方应用
很开心今天参加「一个数据人的自留地」组织的数据人大会
Hive 系列文章(三)Hive高可用部署 HiveServer2高可用及Metastore高可用
Hive 系列文章(二)安装及部署说明
Hive 系列文章(一)初识hive