白老师-白程序员的自习室
白老师的头像-白程序员的自习室
管理员超级版主
这家伙很懒,什么都没有写...
你需要了解的全量表,增量表及拉链表-白程序员的自习室

你需要了解的全量表,增量表及拉链表

你需要了解的全量表,增量表及拉链表定义以及各类型数据入仓方法
2个月前
210830
淘系数据模型治理-白程序员的自习室

淘系数据模型治理

本次分享题目为淘系数据模型治理,主要介绍过去一年淘系数据治理工作的一些总结。 具体将围绕以下4部分展开
5000字长文解析:带你解读阿里大数据建设方法论OneData-白程序员的自习室

5000字长文解析:带你解读阿里大数据建设方法论OneData

在建设大数据数据仓库时,首先要进行充分的业务调研和需求分析,这是数据仓库建设的基石,业务调研和需求分析做得是否充分直接决定了数据仓库建设是否成功。其次进行数据总体架构设计,主要是根...
2个月前
17091
介绍一款Hive数仓可视化神器、Dbeaver的配置和使用方法-白程序员的自习室

介绍一款Hive数仓可视化神器、Dbeaver的配置和使用方法

Dbeaver是一个图形化的界面工具,专门用于与各种数据库的集成,通过dbeaver我们可以与各种数据库进行集成。通过图形化界面的方式来操作我们的数据库与数据库表,类似于我们的sqlyog或者navicat...
centos7 下python2与python3共存-白程序员的自习室

centos7 下python2与python3共存

centos7 下python2与python3共存
pyspark 如何设置python的版本-白程序员的自习室

pyspark 如何设置python的版本

PySpark 在工作程序中都需要使用的为默认环境的python版本,怎样把python的版本切换成3的版本,您可以通过 `PYSPARK_PYTHON` 指定要使用的Python版本。
数据相关常用名词,指标、标签、度量、口径、数据标准、血缘等名词解析-白程序员的自习室

数据相关常用名词,指标、标签、度量、口径、数据标准、血缘等名词解析

这里整理了数据人员,经常会接触到的名词和概念,了解这些专有名词对于数据研发和数据分析时,人员协作及研发都有很高的作用。
Max Os 下安装和配置Python virtualenv虚拟环境-白程序员的自习室

Max Os 下安装和配置Python virtualenv虚拟环境

简介 virtualenv 官方文档对virtualenv的解释是:virtualenv is a tool to create isolated Python environments。 用它可以创建一个独立的 Python 环境,每个项目都可以有一个专属环境,避免了...
python模块:JSON模块-白程序员的自习室

python模块:JSON模块

在日常开发中,对数据进行序列化和反序列化,是常备的操作。而在Python标准库中提供了json模块对JSON数据的处理功能。
python 之 Django与Celery的安装使用-白程序员的自习室

python 之 Django与Celery的安装使用

Celery 是一个强大的 分布式任务队列 的 异步处理框架,它可以让任务的执行完全脱离主程序,甚至可以被分配到其他主机上运行。我们通常使用它来实现异步任务(async task)和定时任务(crontab...

作者博客公众号 dabaispace
欢迎关注微信公众号:
白程序员的自习室