总体一致: Hive-sql与SQL基本上一样,因为当初的设计目的,就是让会SQL不会编程MapReduce的也能使用Hadoop进行处理数据。 因此,大胆使用SQL的,如果...
IP属地:广东
总体一致: Hive-sql与SQL基本上一样,因为当初的设计目的,就是让会SQL不会编程MapReduce的也能使用Hadoop进行处理数据。 因此,大胆使用SQL的,如果...
Flume简介 Flume is a distributed, reliable, and available service for efficiently col...
前言 本文是基础性文章,针对初次接触flume的朋友,简化了大部分内容,后续有时间会加上相关高级使用 为什么需要flume? 解耦:对于数据产生者,不关心数据被谁使用,对于数...
简介 iptables作为Linux系统的防火墙服务,我们几乎不可避免的会用到这项服务。而iptables有非常多的规则,这里我们就简单介绍一些常用的iptables技巧 i...
简单操作技巧 使用 iptables -L 查看当前环境的 iptables 规则还未设置访问规则 插入禁止访问的规则禁止所有ip地址通过TCP方式访问8443端口 对特定 ...
如何设置spark.kryoserializer.buffer.max value 在运行Spark计算任务时,出现了Buffer Overflow错误,Kryo序列化在序列...
Spark的相关名词有时候学着学着会弄混,就趁着这次自己总结一次,也许不是很好,但不能因此就放弃不写; Driver 提交Spark Application(应用)的机器。有...
Linux系统很多使用都是使用在服务器上,登录以及使用常常都是通过SSH远程方式,所以查看Linux系统信息并不是象一些拥有GUI界面系统一样那么直观集中。 本教程将指导你通...