hadoop集群配置LZO压缩以及支持Hive


Dbeaver解决无法下载数据库驱动

Dbeaver解决无法下载数据库驱动

Dbeaver是一个图形化的界面工具,专门用于与各种数据库的集成,通过dbeaver我们可以与各种数据库进行集成,不同的数据库类型连接其需要下载不同的驱动,往往驱动包都是国外,因为都知道的原因会出现下载慢和无法下载驱动的问题,下面整理了解决驱动下载问题的方法。

hive 学习之路(六)、Hive可视化工具Dbeaver配置使用

hive 学习之路(五)、Hive的分区表与分桶表

hive 学习之路(五)、Hive的分区表与分桶表

Hive将表划分为分区(partition)表和分桶(bucket)表。分区可以让数据的部分查询变得更快,也就是说,在加载数据的时候可以指定加载某一部分数据,并不是全量的数据。分桶表通常是在原始数据中加入一些额外的结构,这些结构可以用于高效的查询,例如,基于ID的分桶可以使得用户的查询非常的块。



hive 学习之路(三)hive存储格式

Hive会为每个创建的数据库在HDFS上创建一个目录,该数据库的表会以子目录形式存储,表中的数据会以表目录下的文件形式存储。对于default数据库,默认的缺省数据库没有自己的目录,default数据库下的表默认存放在/user/hive/warehouse目录下。