大数据学习资料-白程序员的自习室
大家都在看
你需要了解的全量表,增量表及拉链表-白程序员的自习室

你需要了解的全量表,增量表及拉链表

你需要了解的全量表,增量表及拉链表定义以及各类型数据入仓方法
2个月前
210830
5000字长文解析:带你解读阿里大数据建设方法论OneData-白程序员的自习室

5000字长文解析:带你解读阿里大数据建设方法论OneData

在建设大数据数据仓库时,首先要进行充分的业务调研和需求分析,这是数据仓库建设的基石,业务调研和需求分析做得是否充分直接决定了数据仓库建设是否成功。其次进行数据总体架构设计,主要是根...
2个月前
17091
介绍一款Hive数仓可视化神器、Dbeaver的配置和使用方法-白程序员的自习室

介绍一款Hive数仓可视化神器、Dbeaver的配置和使用方法

Dbeaver是一个图形化的界面工具,专门用于与各种数据库的集成,通过dbeaver我们可以与各种数据库进行集成。通过图形化界面的方式来操作我们的数据库与数据库表,类似于我们的sqlyog或者navicat...
数据相关常用名词,指标、标签、度量、口径、数据标准、血缘等名词解析-白程序员的自习室

数据相关常用名词,指标、标签、度量、口径、数据标准、血缘等名词解析

这里整理了数据人员,经常会接触到的名词和概念,了解这些专有名词对于数据研发和数据分析时,人员协作及研发都有很高的作用。

centos7 下python2与python3共存

centos7 下python2与python3共存
pyspark 如何设置python的版本-白程序员的自习室

pyspark 如何设置python的版本

PySpark 在工作程序中都需要使用的为默认环境的python版本,怎样把python的版本切换成3的版本,您可以通过 `PYSPARK_PYTHON` 指定要使用的Python版本。

python 中 requirements.txt 文件的安装和使用

在 Python 项目中 requirements.txt文件,记录了当前程序所有依赖包以及对应的版本号。它可以保证项目依赖包版本的确定性, 不会因为依赖更新而导致异常产生.

Max Os 下安装和配置Python virtualenv虚拟环境

简介 virtualenv 官方文档对virtualenv的解释是:virtualenv is a tool to create isolated Python environments。 用它可以创建一个独立的 Python 环境,每个项目都可以有一个专属环境,避免了...

python模块:JSON模块

在日常开发中,对数据进行序列化和反序列化,是常备的操作。而在Python标准库中提供了json模块对JSON数据的处理功能。
python 之 Django与Celery的安装使用-白程序员的自习室

python 之 Django与Celery的安装使用

Celery 是一个强大的 分布式任务队列 的 异步处理框架,它可以让任务的执行完全脱离主程序,甚至可以被分配到其他主机上运行。我们通常使用它来实现异步任务(async task)和定时任务(crontab...