Parquet调研报告 1. 概述 1.1 简介 Apache Parquet是Hadoop生态圈中一种新型列式存储格式,它可以兼容Hadoop生态圈中大多数计算框架(Had...
Parquet调研报告 1. 概述 1.1 简介 Apache Parquet是Hadoop生态圈中一种新型列式存储格式,它可以兼容Hadoop生态圈中大多数计算框架(Had...
1、端口 9000端口:是fileSystem默认的端口号:50070端口: 50070是hdfs的web管理页面的端口 (50070端口也可以查看hdfs 的总存储 ...
相关概念说明 SPNEGO:简单且受保护的 GSS-API 协商机制中定义的一项标准规范。如果启用SPNEGO Web 认证,那么在处理第一个入站 HTTP 请求时会对 SP...
作者:黄湘龙 研究HTTPS的双向认证实现与原理,踩了不少坑,终于整个流程都跑通了,现在总结出一篇文档来,把一些心得,特别是容易踩坑的地方记录下来。 1.原理 双向认证,顾名...
在命令行执行 hadoop fs -ls / 这种 Hadoop Commands 时,系统内部是怎样处理的呢? 1. bash 处理 可以用 linux 的which和ll...
高可用是一个健壮的系统必备的特性,实现高可用的方法有很多,这篇文章简要介绍了实现高可用的方法,适合浏览一遍熟悉高可用的概况。我的这篇文章的主要目的是介绍如何用zookeepe...
在上一篇分享中,我们介绍了ClickHouse的安装部署和简单使用。本文将介绍ClickHouse中一个非常重要的概念—表引擎(table engine)。如果对MySQL熟...
在Java J2EE方面进行面试时,常被问起的Hibernate面试问题,大多都是针对基于Web的企业级应用开发者的角色的。Hibernate框架在Java界的成功和高度的可...
好久没更新了,。。。太懒了。 在跑Spark-On-Yarn程序的时候,往往会对几个参数(num-executors,executor-cores,executor-memo...