记录学习时光,重拾学习乐趣

  1. Flume 知识点(四)Flume NG 常见数据流拓扑

    如何构建数据流拓扑?


    大数据 Flume
    2019/09/15
  2. Flume 知识点(三)Flume的Source类型

    Flume的Source类型。


    大数据 Flume
    2019/09/15
  3. Flume 知识点(二)Flume 高级组件(Interceptor,Channel Selector 和 Sink Processor)

    除了 Source、channel、Sink外,Flume Agent 还允许用户设置其他组件更灵活地控制数据流,包括 Interceptor,Channel Selector 和 Sink Processor。


    大数据 Flume
    2019/09/14
  4. Flume 知识点(一)Flume 概述和基本架构

    Flume 是一个分布式、可靠且高可用的服务,用于有效地收集,聚合和移动大量日志数据。


    大数据 Flume
    2019/09/14
  5. Spark系列文章(六):Spark的共享变量

    Spark 提供了两种受限的共享变量:广播变量和共享变量,从而实现更加高效的运算。


    大数据 Spark
    2019/09/09
  6. Spark系列文章(四):Spark之RDD

    RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,代表一个不可变、可分区、里面的元素可并行计算的集合。


    大数据 Spark
    2019/09/09
  7. Spark系列文章(三):搭建Spark开发环境IDEA

    构建Spark运行环境,在IDEA上利用maven进行构建


  8. Spark系列文章(二):Spark伪分布式安装


  9. Hbase知识点(五)HBase过滤器(Filter)

    HBase 的基本 API,提供了包括增、删、改、查等的操作。相对而言,与传统的关系型数据库相比,查询略显苍白。只能根据特性的行键进行查询(Get)或者根据行键的范围来查询(Scan)。 为此 HBase 提供了高级的查询方法:过滤器 Filter 。


    HBase Hadoop Java 大数据
    2019/09/05
  10. Hbase知识点(四)Hbase基本架构和原理

    HBase 采用了经典的 master/slave 架构,与 Hdfs 不同的是,他的 master 与 slave 不直接互联,而是引入 zookeeper 让两类服务解耦,这样使得 master 变得完全无状态,而避免了 master 宕机导致的整个集群不可用。


用数据改变世界,让数据变成未来。

人生苦短,我学python

工欲善其事,必先利其器


白贺的个人技术文章分享

1 3

关于自己 python 学习的相关demo

0 0

基于 amazon advertising v2 接口的 PHP 广告信息组件

0 1

个人博客评论地址

0 0

0 0