Mac OS 终端 iTerm2 之前一直使用的 Mac OS 自带的终端,觉得也还可以,后来看大神 onevcat 的直播视频,发现他用的是 iTerm,真的是非常好用,于...
Mac OS 终端 iTerm2 之前一直使用的 Mac OS 自带的终端,觉得也还可以,后来看大神 onevcat 的直播视频,发现他用的是 iTerm,真的是非常好用,于...
最近接触到workspace,正在学习使用Notion来梳理自己的生活、学习和工作,提升效率。由于有一段时间没有用Markdown码字了,好多东西都生疏了,因此结合Notio...
1. Apache Kylin 是什么? Apache Kylin™是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数...
一、Storm简介 Storm是一个免费并开源的分布式实时计算系统。利用Storm可以很容易做到可靠地处理无限的数据流,像Hadoop批量处理大数据一样,Storm可以实时处...
Storm集群中的任务称之为Topology。 对比Hadoop中的MapReduce job,mapper用于从数据源中获取数据,经过简单处理,以一定的格式传递给reduc...
意译一篇《scala面试问题》的博客,原文地址:http://pedrorijo.com/blog/scala-interview-questions/,代码示例我在本地做了...
附上原文链接(在此基础上自己做了补充和修改。) ZooKeeper 1. CAP定理 C:一致性(读操作总能读到以前的写操作)A:可用性(在单台机器出错时,仍然能正常工作,不...
摘要:本文将向您讲述诸多数据处理面试题以及方法的总结。 第一部分、十道海量数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 此题,在我之前的一篇文章算...
今日我在eclipse上运行Map/Reduce框架进行数据分析的时候遇到了一个很奇怪的错误:一开始我发现运行程序之后也没在控制台报错,也生成了目标目录,但一直出不来统计好的...