240 发简信
wlu
IP属地:江苏
  • Resize,w 360,h 240
    Apache Geode with Spark

    在一些特定场景,例如streamingRDD需要和历史数据进行join从而获得一些profile信息,此时形成较小的新数据RDD和很大的历史RD...

  • Dremel made simple with Parquet

    Dremel made simple with ParquetBy @J_Wednesday, 11 September 2013 [ ](ht...

  • Resize,w 360,h 240
    Debezium for PostgreSQL to Kafka

    In this article, we discuss the necessity of segregate data model for r...

  • MLLib实践Naive Bayes

    引言 本文基于Spark (1.5.0) ml库提供的pipeline完整地实践一次文本分类。pipeline将串联单词分割(tokenize)...