原创2020-07-23 大数据 / hive10 分钟 读完 (大约 1490 个字)hive 自定义函数浅谈(UDF、UDAF、UDTF)hive的内置函数满足不了所有的业务需求,hive提供很多的模块可以自定义功能,比如:自定义函数、serde、输入输出格式等。 hive 阅读更多>>
原创2020-06-28 大数据 / hadoop3 分钟 读完 (大约 504 个字)hadoop集群配置LZO压缩以及支持Hivehadoop集群配置LZO压缩,在集群上运行jar包生成loz文件,以及支持Hive. 大数据hivehadoop 最后修改: 2020-06-28 阅读更多>>
原创2020-06-09 大数据 / hive2 分钟 读完 (大约 325 个字)hive 学习之路(六)、Hive可视化工具Dbeaver配置使用Dbeaver是一个图形化的界面工具,专门用于与各种数据库的集成,通过dbeaver我们可以与各种数据库进行集成。通过图形化界面的方式来操作我们的数据库与数据库表,类似于我们的sqlyog或者navicat。 大数据hive 最后修改: 2020-06-09 阅读更多>>
原创2020-06-08 大数据 / hive13 分钟 读完 (大约 1913 个字)hive 学习之路(五)、Hive的分区表与分桶表Hive将表划分为分区(partition)表和分桶(bucket)表。分区可以让数据的部分查询变得更快,也就是说,在加载数据的时候可以指定加载某一部分数据,并不是全量的数据。分桶表通常是在原始数据中加入一些额外的结构,这些结构可以用于高效的查询,例如,基于ID的分桶可以使得用户的查询非常的块。 hive 最后修改: 2020-06-08 阅读更多>>
原创2020-05-23 大数据 / hive3 分钟 读完 (大约 433 个字)hive 常见报错以及解决方案整理汇总hive使用过程中遇到的问题以及解决办法。 大数据hive 最后修改: 2020-05-23 阅读更多>>
原创2020-05-04 大数据 / hive9 分钟 读完 (大约 1414 个字)hive 学习之路(四)HQL的基本语法HQL 是建立在 Hive 上的类sql语言,虽然和mysql等sql语言有很多一致的地方,但还是有所不同的。本文整理汇总了 HQL的 相关 DDL 操作。 大数据hive 最后修改: 2020-05-04 阅读更多>>
原创2020-05-04 大数据 / hive3 分钟 读完 (大约 394 个字)hive 学习之路(三)hive存储格式Hive会为每个创建的数据库在HDFS上创建一个目录,该数据库的表会以子目录形式存储,表中的数据会以表目录下的文件形式存储。对于default数据库,默认的缺省数据库没有自己的目录,default数据库下的表默认存放在/user/hive/warehouse目录下。 大数据hive 最后修改: 2020-05-04 阅读更多>>
原创2020-05-04 大数据 / hive10 分钟 读完 (大约 1449 个字)hive 学习之路(二)伪分布式安装Hive 是基于 Hadoop 的数据仓库解决方案,所以默认代表已经安装 Hadoop,本文只要整理了伪分布式场景下的安装和简单实用案例。 大数据hive 最后修改: 2020-05-04 阅读更多>>
原创2020-05-04 大数据 / hive17 分钟 读完 (大约 2516 个字)hive 学习之路(一)初识Hive 是基于 Hadoop 的数据仓库解决方案。由于 Hadoop 本身在数据存储和计算方面有很好的可扩展性和高容错性,因此使用 Hive 构建的数据仓库也秉承了这些特性。 大数据hive 最后修改: 2020-05-04 阅读更多>>