1 需求分析 WebServer/ApplicationServer分散在各个机器上,然而我们依旧想在Hadoop平台上进行统计分析,如何将日志...
1 需求分析 WebServer/ApplicationServer分散在各个机器上,然而我们依旧想在Hadoop平台上进行统计分析,如何将日志...
淘宝大数据平台 淘宝可能是中国互联网业界较早搭建了自己大数据平台的公司,下图是淘宝早期的Hadoop大数据平台,比较典型。 淘宝的大数据平台基本...
本文主要分以下章节: 一、Spark专业术语定义 二、 Spark的任务提交机制 一、Spark专业术语定义 1、Application:Spa...
hive架构组件:meta storecli clientjdbc clientdriversql parser解析器physical plan...
以Hive2.3.4为例进行学习 元数据表总览 一共有57张表,大致分类下:image.png 版本表VERSION 如果该表出现问题,根本进入...
基础性的东西,不过在回答的时候要能回答出彩来 什么是Hive Hive是由Facebook开源用于解决海量结构化日志的数据统计;Hive是基于H...
1 回顾 透露一下,本人是双非二本,自从高考失利以后还以为自己要一直这么平凡下去,没想到过了三年终于又给我一个机会让我重新证明了自己,能给我去阿...
【说明】看到这样一篇文章https://towardsdatascience.com/sql-cheat-sheet-for-interview...
DataX是一个在异构的数据库/文件系统之间高速交换数据的工具,实现了在任意的数据处理系统(RDBMS/Hdfs/Local filesyste...
阿里蚂蚁金服专场面试系列题 01 技术一面 线程池有哪些参数?分别有什么用?如果任务数超过的核心线程数,会发生什么?阻塞队列大小是多少? 数据库...
专题公告
大数据面试