大数据学习资料-白程序员的自习室
大家都在看第2页
最值得阅读的数据仓库书籍推荐-白程序员的自习室

最值得阅读的数据仓库书籍推荐

从事数仓工作几年了,在工作学习过程也看了很多数据仓库方面的,此处整理了对自己帮助较大的部分,给大家推荐一下,希望能帮助到大家。
2个月前
08980
最全面的数仓分层剖析,一文搞定企业数仓分层-白程序员的自习室

最全面的数仓分层剖析,一文搞定企业数仓分层

从事数仓相关工作的人员都知道数仓模型设计的首要工作之一就是模型分层,可见模型分层在模型实际过程中的重要性,确实优秀的分层设计是一个数仓项目能否建设成功的核心要素,让数据易理解和高复...
2个月前
08370
浅谈数仓分层和模型-白程序员的自习室

浅谈数仓分层和模型

数仓为空间换时间,通过大量预处理,提升用户数据效率体现等。故而存在大量数据冗余。如果不分层,源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大。通过数据分层管理可以简...
2个月前
08790
都说数仓是面向主题建设的,那数仓的主题和主题域又应该怎么划分呢?-白程序员的自习室

都说数仓是面向主题建设的,那数仓的主题和主题域又应该怎么划分呢?

数仓在建设过程中,对数据的组织管理上,不仅仅要进行横向的分层,也需要根据业务情况进行纵向的主题域划分。为保证整个数仓体系的生命力,数据域需要抽象提炼,长期维护及更新,但不要轻易变动...
2个月前
04040
😊  数仓开发规范-白程序员的自习室

😊 数仓开发规范

本文针对数仓onedata的建设,整理了数仓开发相关的规范信息,希望可以帮助到大家。
2个月前
06470
💡 数仓命名规范-白程序员的自习室

💡 数仓命名规范

本文针对数仓onedata的建设,整理了数仓命名相关的规范信息,希望可以帮助到大家。
2个月前
010000
精心整理的Hive数据导入导出的几种方式-白程序员的自习室

精心整理的Hive数据导入导出的几种方式

作为数据仓库的Hive,存储着海量用户数据,在平常的Hive使用过程中,难免对遇到将外部数据导入到Hive或将Hive中的数据导出的情况。
深入浅出Hive数据倾斜,最全面的讲解(好文收藏)-白程序员的自习室

深入浅出Hive数据倾斜,最全面的讲解(好文收藏)

本文将为你深入浅出地讲解什么是Hive数据倾斜、数据倾斜产生的原因以及面对数据倾斜的解决方法,从而帮你快速完成工作!
最全面的Hive开窗函数讲解和实战指南(必看)-白程序员的自习室

最全面的Hive开窗函数讲解和实战指南(必看)

在报表等数据分析场景中,你会发现窗口函数真的很强大,灵活运用串口函数可以解决很多复杂问题,比如去重、排名、同比及环比、连续登录等等。本文将对窗口函数进行一个全面的整理,讲一讲窗口函...

hive 自定义函数浅谈(UDF、UDAF、UDTF)

hive的内置函数满足不了所有的业务需求,hive提供很多的模块可以自定义功能,比如:自定义函数、serde、输入输出格式等。