steanxy - 简书

steanxy

IP属地：山东

[译]Scala Extractor Objects
Extractor Object是有unapply方法的对象。apply方法像是构造函数，可以带参数以及创建对象，unapply方法根据对象尝试...

575 0 0
[译]Scala正则表达式模式
正则表达式是用于找出数据中模式的字符串。任何字符串都可以使用.r方法转换为正则表达式。在上面例子中，numberPattern是一个Regex...

1557 0 1

[译]Spark Streaming编程指南（四）
缓存/持久化和RDD类似，DStream允许开发者将流数据持久化到内存。使用在DStream上使用persist()方法会自动持久化DStre...

462 0 0
[译]Spark Streaming编程指南（三）
DStreams转换（Transformation）和RDD类似，转换中允许输入DStream中的数据被修改。DStream支持很多Spark...

823 0 0
[译]Spark Streaming + Kafka集成指南
本文适用于Kafka broker 0.8.2.1及更高版本。这里会说明如何配置Spark Streaming接收Kafka的数据。有两种方法...

1243 0 7
[译]Spark Streaming编程指南（二）
链接和Spark类似，Spark Streaming通过Maven Central提供。为编写Spark Streaming程序，需要添加下面...

591 0 0
[译]Spark Streaming编程指南（一）
概述 Spark Streaming是核心Spark API的扩展，对实时数据流地处理具有可扩展，高吞吐量和容错特性。数据可从很多源获取，如Ka...

629 0 0

[译]Spark编程指南（三）
共享变量通常，当一个函数传递给在远程集群节点上执行的Spark操作（如map或reduce）时，函数使用的是所有变量的独立副本。这些变量会拷贝...

683 0 0
[译]Flume1.7.0用户手册（一）
介绍概述 Apache Flume是一个分布式的，可靠的，高可用的系统，用于高效地从多个不同的数据源收集，汇总及迁移大量日志数据到集中的数据储...

0.1 1081 0 1