一、什么是 Flume? 1、Flume 是做什么的? Flume 是 Cloudera 开发的一个高可用、高可靠、分布式的海量日志采集、聚合和传输的系统。Flume 支...
前置文章:Elasticsearch-RestClient基础[https://www.jianshu.com/p/896528fac5bc] 零、本文纲要 一、查询DSL0...
业务场景:需要将服务器A上的mysql数据库迁移到另外一台服务器B。 命令格式 选项说明 参数名缩写含义--host-h服务器IP地址--port-P服务器端口号--user...
前置文章:一、MySQL-存储引擎[https://www.jianshu.com/p/495108c767bc] 零、本文纲要 一、事务 二、MySQL事务原理 三、red...
方法一 Run --> Edit Configurations --> Maven --> "+" --> Parameters --> Command line 填入cle...
1.安装Miniconda 1)下载Miniconda(python3版本)下载地址(清华大学镜像站miniconda下载地址):https://mirrors.tuna.t...
1、pip流 装了pip可以无视步骤2,但是专业人士一般会使用Anaconda 1.1、装pip https://pip.pypa.io/en/stable/installi...
本文的主要内容包括七个部分: 1、为什么要有规范? 2、规范该怎么落地? 3、数仓规范有哪些? 4、设计规范 5、流程规范 6、质量管控规范 推荐读一读。 正文开始 这是数据...
“设计”——暗含了可以预先对组成单元进行规划的意思,“兵马未动,粮草先行”体现了前人在规划事情的聪明才智。但是数据仓库的需求只有在已经装载了部分数据并开始使用的时候才能弄清楚...
文章目录 一、用户画像数据仓库搭建、数据抽取部分[https://editor.csdn.net/md/?articleId=109890183#_15] 二、大数据平台、用...
step1:生成 GUID 的网址 https://www.guidgen.com/ step2:用这个网址 + 生成的 GUID 激活 https://jrebel.qek...
zxid,也就是事务id, 为了保证事务的顺序一致性,zookeeper 采用了递增的事 务 id 号(zxid)来标识事务。所有的提议(proposal)都 在被提出的时...
实现spark远程连接hive数据库,需要将服务端mysql数据库里的hive数据表DBS和SDS里的localhost改为可以访问到的IP地址或域名。 更改方式参考:hiv...
之前介绍过Apache Spark的基本概念以及环境准备,本篇以分类算法为入口,主要熟悉下Spark的Python API,重点不在算法,而是API的熟悉,具体的分类算法会给...
MySQL 作为互联网中非常热门的数据库,其底层的存储引擎和数据检索引擎的设计非常重要,尤其是 MySQL 数据的存储形式以及索引的设计,决定了 MySQL 整体的数据检索性...
买了个阿里云的服务器,每年好像几百块钱。 买了服务器后就在服务器上安装宝塔。如下图: 宝塔可以监控服务器,当然上面还有好多可以安装的插件。比较适合新手。 宝塔安装地址: 宝塔...