Hadoop 基础
HDFS的概念 Hadoop Distributed File System ,Hadoop分布式文件系统,主要用来解决海量数据的存储问题 文件级别的分布式系统 块级别的分布式系统 设计思想 分散均匀存储 dfs.blocksize = 128M ...
Hadoop 发展背景和简介
Hadoop产生的背景 HADOOP最早起源于Nutch。Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取、索引、查询等功能,但随着抓取网页数量的增加,遇到了严重的可扩展性问题——如何解决...