你真的了解数仓元数据吗,数据地图你又知道多少?
数仓元数据是什么?又分为技术元数据、业务元数据。你知道吗数仓元数据的管理一般是构建数据管理中心,产品化也就是数据地图,这些你都知道吗?
最全面的数仓分层剖析,一文搞定企业数仓分层
从事数仓相关工作的人员都知道数仓模型设计的首要工作之一就是模型分层,可见模型分层在模型实际过程中的重要性,确实优秀的分层设计是一个数仓项目能否建设成功的核心要素,让数据易理解和高复...
都说数仓是面向主题建设的,那数仓的主题和主题域又应该怎么划分呢?
数仓在建设过程中,对数据的组织管理上,不仅仅要进行横向的分层,也需要根据业务情况进行纵向的主题域划分。为保证整个数仓体系的生命力,数据域需要抽象提炼,长期维护及更新,但不要轻易变动...
精心整理的Hive数据导入导出的几种方式
作为数据仓库的Hive,存储着海量用户数据,在平常的Hive使用过程中,难免对遇到将外部数据导入到Hive或将Hive中的数据导出的情况。
深入浅出Hive数据倾斜,最全面的讲解(好文收藏)
本文将为你深入浅出地讲解什么是Hive数据倾斜、数据倾斜产生的原因以及面对数据倾斜的解决方法,从而帮你快速完成工作!