白老师-白程序员的自习室-第2页
白老师的头像-白程序员的自习室
管理员超级版主
这家伙很懒,什么都没有写...
你需要了解的全量表,增量表及拉链表-白程序员的自习室

你需要了解的全量表,增量表及拉链表

你需要了解的全量表,增量表及拉链表定义以及各类型数据入仓方法
2个月前
210830
你真的了解数仓元数据吗,数据地图你又知道多少?-白程序员的自习室

你真的了解数仓元数据吗,数据地图你又知道多少?

数仓元数据是什么?又分为技术元数据、业务元数据。你知道吗数仓元数据的管理一般是构建数据管理中心,产品化也就是数据地图,这些你都知道吗?
2个月前
016930
最值得阅读的数据仓库书籍推荐-白程序员的自习室

最值得阅读的数据仓库书籍推荐

从事数仓工作几年了,在工作学习过程也看了很多数据仓库方面的,此处整理了对自己帮助较大的部分,给大家推荐一下,希望能帮助到大家。
2个月前
08990
最全面的数仓分层剖析,一文搞定企业数仓分层-白程序员的自习室

最全面的数仓分层剖析,一文搞定企业数仓分层

从事数仓相关工作的人员都知道数仓模型设计的首要工作之一就是模型分层,可见模型分层在模型实际过程中的重要性,确实优秀的分层设计是一个数仓项目能否建设成功的核心要素,让数据易理解和高复...
2个月前
08370
浅谈数仓分层和模型-白程序员的自习室

浅谈数仓分层和模型

数仓为空间换时间,通过大量预处理,提升用户数据效率体现等。故而存在大量数据冗余。如果不分层,源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大。通过数据分层管理可以简...
2个月前
08790
都说数仓是面向主题建设的,那数仓的主题和主题域又应该怎么划分呢?-白程序员的自习室

都说数仓是面向主题建设的,那数仓的主题和主题域又应该怎么划分呢?

数仓在建设过程中,对数据的组织管理上,不仅仅要进行横向的分层,也需要根据业务情况进行纵向的主题域划分。为保证整个数仓体系的生命力,数据域需要抽象提炼,长期维护及更新,但不要轻易变动...
2个月前
04040
😊  数仓开发规范-白程序员的自习室

😊 数仓开发规范

本文针对数仓onedata的建设,整理了数仓开发相关的规范信息,希望可以帮助到大家。
2个月前
06470
💡 数仓命名规范-白程序员的自习室

💡 数仓命名规范

本文针对数仓onedata的建设,整理了数仓命名相关的规范信息,希望可以帮助到大家。
2个月前
010000
精心整理的Hive数据导入导出的几种方式-白程序员的自习室

精心整理的Hive数据导入导出的几种方式

作为数据仓库的Hive,存储着海量用户数据,在平常的Hive使用过程中,难免对遇到将外部数据导入到Hive或将Hive中的数据导出的情况。
深入浅出Hive数据倾斜,最全面的讲解(好文收藏)-白程序员的自习室

深入浅出Hive数据倾斜,最全面的讲解(好文收藏)

本文将为你深入浅出地讲解什么是Hive数据倾斜、数据倾斜产生的原因以及面对数据倾斜的解决方法,从而帮你快速完成工作!

作者博客公众号 dabaispace
欢迎关注微信公众号:
白程序员的自习室