日记本 - 文集

日记本

28篇文章 · 40324字 · 1人关注

Hbase简介
1.Hbase起源 HBase是一个开源的非关系型分布式数据库，它参考了谷歌的BigTable建模，实现的编程语言为Java。它是Apache软...

4.2 75154 2 28
Spark RDD运行原理详解
弹性分布式数据集RDD表示一个分区数据元素的集合，可以在其上进行并行操作。它是Spark的主要数据抽象概念。它是Spark库中定义的一个抽象类。...

11088 0 2

大数据处理框架Spark简介
Spark是一个基于内存的用于处理、分析大数据的集群计算框架。Spark最初由美国加州大学伯克利分校（UC Berkelely）的AMP（Alg...

5927 0 0
分布式文件系统HDFS
1.HDFS简介正如其名，HDFS（Hadoop Distribution File System）是一个分布式文件系统，它在商用服务器集群中...

0.3 7229 0 2
大数据Hadoop框架简介
Hadoop发展简史 Hadoop最初是由Apache Lucene项目的创始人DougCutting开发的文本搜索库。Hadoop源自始于20...

5046 0 1
Mybatis分页插件的使用流程
如果你也在用Mybatis，建议尝试该分页插件，这一定是最方便使用的分页插件。该插件支持任何复杂的单表、多表分页。 1.引入PageHelper...

4822 0 2
Mybatis动态SQL的使用方法
Mybatis的强大特性之一便是它的动态SQL。在实际开发中，数据库的查询比较复杂，需要在不同的逻辑中执行不同的SQL语句。我们往往要根据各种不...

9643 0 2

Windows上的PyCharm 远程连接调试pyspark
在实验室配置了一个Spark集群，传统的方法就是在Windows本地开发项目，完了后打包，然后上传到Linux服务器上，最后执行spark-su...

0.2 12339 3 6
Apache Spark之文件读写
除了对本地文件系统进行读写以外，Spark还支持很多常见的文件格式（文本文件、JSON）和文件系统（HDFS）和数据库（MySQL、Hive、H...

11347 2 1