白老师-白程序员的自习室
白老师的头像-白程序员的自习室
管理员超级版主
这家伙很懒,什么都没有写...
5000字长文解析:带你解读阿里大数据建设方法论OneData-白程序员的自习室

5000字长文解析:带你解读阿里大数据建设方法论OneData

在建设大数据数据仓库时,首先要进行充分的业务调研和需求分析,这是数据仓库建设的基石,业务调研和需求分析做得是否充分直接决定了数据仓库建设是否成功。其次进行数据总体架构设计,主要是根...
2个月前
17091
服务器常用技术点-白程序员的自习室

服务器常用技术点

延长SSH的连接超时时间 SSH登录连接服务器时,默认的连接超时时间很短,经常会断掉,为方便管理修改sshd的配置文件,然后重启sshd服务。 vim /etc/ssh/sshd_config; #查找并修改 #ClientAliveInte...
3年前
04114
数据相关常用名词,指标、标签、度量、口径、数据标准、血缘等名词解析-白程序员的自习室

数据相关常用名词,指标、标签、度量、口径、数据标准、血缘等名词解析

这里整理了数据人员,经常会接触到的名词和概念,了解这些专有名词对于数据研发和数据分析时,人员协作及研发都有很高的作用。
最全面的Hive开窗函数讲解和实战指南(必看)-白程序员的自习室

最全面的Hive开窗函数讲解和实战指南(必看)

在报表等数据分析场景中,你会发现窗口函数真的很强大,灵活运用串口函数可以解决很多复杂问题,比如去重、排名、同比及环比、连续登录等等。本文将对窗口函数进行一个全面的整理,讲一讲窗口函...
🏆 IntellJ IDEA  激活码2021 激活码2022 每日更新 长期提供【JetBrains全家桶】-白程序员的自习室

🏆 IntellJ IDEA 激活码2021 激活码2022 每日更新 长期提供【JetBrains全家桶】

jetbrains 全家桶激活码,实测可用,每日都会更新,长期提供。再也不用怕突然激活码失效的尴尬了。
27天前
05.1W+0
淘系数据模型治理-白程序员的自习室

淘系数据模型治理

本次分享题目为淘系数据模型治理,主要介绍过去一年淘系数据治理工作的一些总结。 具体将围绕以下4部分展开
数仓规范化,菜鸟数据模型管理实践-白程序员的自习室

数仓规范化,菜鸟数据模型管理实践

数仓规范化——菜鸟数据模型管理实践 导读:本文将分享菜鸟数仓规划过程中的数仓管理模型实践,主要围绕以下内容展开: 菜鸟末端业务介绍 模型管理整体规划 数据建模平台建设 总结&展望 问...
pyspark 如何设置python的版本-白程序员的自习室

pyspark 如何设置python的版本

PySpark 在工作程序中都需要使用的为默认环境的python版本,怎样把python的版本切换成3的版本,您可以通过 `PYSPARK_PYTHON` 指定要使用的Python版本。
Spark集群安装部署-白程序员的自习室

Spark集群安装部署

安装基础 Java8安装成功 zookeeper安装成功 下载安装包 spark官网下载链接 作者百度网盘链接: https://pan.baidu.com/s/1ytjRn231Gx3RFDSncrj5qQ 密码: 77tm 上传安装包到服务器 cd /opt/softwa...
Spark之RDD-白程序员的自习室

Spark之RDD

RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,代表一个不可变、可分区、里面的元素可并行计算的集合。

作者博客公众号 dabaispace
欢迎关注微信公众号:
白程序员的自习室