Hive简介 什么是hive hive是基于Hadoop的一个数据仓库工具,并不是一个数据库。用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的...
Hive简介 什么是hive hive是基于Hadoop的一个数据仓库工具,并不是一个数据库。用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的...
干啥啥不行,看小说第一名。这不,好好写了一篇文章。 最近整理了一下文章目录,因为好早之前就有兄弟跟我说之前文章找不到,我也懒得整理,现在好好整了一下,发现有一篇文章写了一半我...
RDD序列化 闭包检查 Kryo序列化框架 Java的序列化能够序列化任何的类。单比较重(字节多),序列化后,对象的提交也比较大。Spark2.0开始支持Kryo序列化机制。...
工作机制 zk从设计模式角度理解:是一个基于观察者模式的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦数据状态发生变化,zk就将负责通知已经...
1-获取集合长度-list.length 2-获取集合大小-list.size 3-循环遍历-foreach 4-迭代器-list.iterator 5-生成字符串-list...
普通匹配 匹配常量;类型;模式守卫 匹配数组 匹配列表 方式二(方式一与匹配数组相同) 匹配元组 元组特殊匹配 1)在变量声明时匹配 2)for循环使用 匹配对象及样例类 概...
1)sacla集合有三大类:序列Seq,集Set,映射Map。所有集合都扩展自Iterable特质。2)对于几乎所有集合类,scala都提供了可变和不可变两种版本。分别位于以...
包 一.包嵌套( 1)一个源文件中可以声明多个 package( 2)子包中的类可以直接访问父包中的内容,而无需导包( 3)包对象:在 Scala 中可以为每个包定义一个同名...
函数参数 1.可变参数(多个参数时,可变参数一般放置在最后) 2.参数默认值,一般有默认值的参数放在后面 3.带名参数 至简原则 1.return省略,函数体最后一行作为返回...
一些基础 变量和常量( 1)声明变量时,类型可以省略,编译器自动推导,即类型推导( 2)类型确定后,就不能修改,说明 Scala 是强数据类型语言。( 3)变量声明时,必须要...
Hadoop的元数据主要作用是维护HDFS文件系统中文件和目录的相关信息。元数据存储形式主要由三类:内存镜像、磁盘镜像(fsImage)、日志(EditLog)。在Namen...
优点 1)MapReduce易于编程它简单的实现一些接口,就可以完成一个分布式程序,这个分布式程序可以分布到大量廉价的PC机器上运行。也就是说你写一个分布式程序,跟写一个简单...
概念 1.适合一次写入,多次读出。2.优点:高容错(多副本);适合大数据;可用廉价服务器3.缺点:不适合低延时访问数据;无法高效对大量小文件进行存储;不支持并发写入;不能随机...
一 目录结构 1.bin:存放操作hadoop相关服务的脚本(hdfs;yarn;mapred) 2.sbin:存放启动/停止hadoop相关服务的脚本(hdfs;yarn;...
提交 提交源码 Job.java 提交进JobSubmitter.java 切片 切片源码 JobSubmitter.java InputFormat有很多实现类。默认进入F...
1二分查找 2循环比赛 3汉诺塔(还是不太懂咋移动的汉诺塔) 4零钱兑换 5最大子序列和
接口当中的常量的使用: 1,接口当中定义的常量:可以省略public static final。2,接口当中定义的常量:必须进行赋值。3,接口当中定义的常量:常量的名称要全部...
初学java时都说io流是java中最核心的内容之一,但是往往一听到某某流、某某池的时候,还没开始学就懵了。其实io流在java中也就是一些类。网上的很多图片上把io流接口下...
转载自:http://www.cnblogs.com/dolphin0520/p/3932906.html一、阻塞队列:对队列阻塞,实现消费者-生产者模型。阻塞队列为于juc...
从关系图可以看出FutureTask可以当作一个Runnable被线程执行。Future构造器 示例: