大家都在看
5000字长文解析:带你解读阿里大数据建设方法论OneData
在建设大数据数据仓库时,首先要进行充分的业务调研和需求分析,这是数据仓库建设的基石,业务调研和需求分析做得是否充分直接决定了数据仓库建设是否成功。其次进行数据总体架构设计,主要是根...
介绍一款Hive数仓可视化神器、Dbeaver的配置和使用方法
Dbeaver是一个图形化的界面工具,专门用于与各种数据库的集成,通过dbeaver我们可以与各种数据库进行集成。通过图形化界面的方式来操作我们的数据库与数据库表,类似于我们的sqlyog或者navicat...
pyspark 如何设置python的版本
PySpark 在工作程序中都需要使用的为默认环境的python版本,怎样把python的版本切换成3的版本,您可以通过 `PYSPARK_PYTHON` 指定要使用的Python版本。
python 中 requirements.txt 文件的安装和使用
在 Python 项目中 requirements.txt文件,记录了当前程序所有依赖包以及对应的版本号。它可以保证项目依赖包版本的确定性, 不会因为依赖更新而导致异常产生.
Max Os 下安装和配置Python virtualenv虚拟环境
简介 virtualenv 官方文档对virtualenv的解释是:virtualenv is a tool to create isolated Python environments。 用它可以创建一个独立的 Python 环境,每个项目都可以有一个专属环境,避免了...
python 之 Django与Celery的安装使用
Celery 是一个强大的 分布式任务队列 的 异步处理框架,它可以让任务的执行完全脱离主程序,甚至可以被分配到其他主机上运行。我们通常使用它来实现异步任务(async task)和定时任务(crontab...
白老师 2个月前0
是的,dwd_order_info_di其实是全量表,ods_order_info_20200911代表的是每日新增的数据。 每日取dwd_order_info_di,t-2的分区数据,与ods_order_info_20200911,ods临时表的t-1日变更数据合并,产出到dwd_order_info_di,t-1的分区全量数据。白老师 2个月前0
已添加。。。。。白老师 2个月前0
zan