240 投稿
收录了26篇文章 · 3人关注
  • 开源组件Kafka Connect推荐

    Kafka Connect简介 Kafka Connect是Kafka的开源组件Confluent提供的功能,用于实现Kafka与外部系统的连接...

  • python操作hdfs及hbase

    操作HDFS 创建目录 client.makedirs("/tmp/ct/test51") 默认权限755,用户名:dr.who 可以创建多层...

  • hbase的几点注意摘录

    Rowkey的设计 自增的id可以采用id%n 的方法来划分,避免热点数据分布不均 Hbase的访问方式 Native Java API,最常规...

  • Resize,w 360,h 240
    hbase存储相关浅析

    ​Hbase存储相关介绍 Region Server: 不同Region数据互斥(Table+StartKey+Time);Region数量不能...

  • Resize,w 360,h 240
    ksqlDB用于流处理应用

    概述 ksqlDB是一个事件流数据库,专用来帮助开发人员创建基于Apache Kafka的流处理应用程序。它基于轻量级的SQL语法,大大降低了操...

  • YCSB大数据存储压测工具推荐

    前置工作 针对大数据相关存储进行压测,本文以Hbase1.2.X版本为例进行描述: 获取二进制文件 方式1:源码下载git@github.com...

  • kafka最佳实践5点建议

    Kafka作为分布式系统、异步消息系统等应用常用技术栈,是一个很受开发者欢迎的消息处理方案;在实践过程中,也总结出了一些较适用的实践经验。 建议...

  • kafka命令行及python操作实践

    环境准备 前置:KAFKA_HOME及ZK_IP_PORT_LIST的取值视具体的环境信息来定 kafka的安装目录及启动 kafka创建top...

  • Confluent工具用于kafka监控

    搭建confluent运行环境 基于docker镜像,上面的内容制作yml文件,运行docker-compose up -d -build下载镜...

  • ksql-datagen测试数据生成器

    测试数据生成器ksql-datagen 用法 DataGen [help] [bootstrap-server= (defaults to lo...

专题公告

大数据相关技术的积累与分享