240 投稿
收录了33篇文章 · 7人关注
  • Kafka主从同步及leader&follower

    Kafka允许topic的分区拥有若干副本,这个数量是可以配置的,你可以为每个topci配置副本的数量。Kafka会自动在每个个副本上备份数据,...

  • 数字货币相关板块单位简介

    简介: 广电运通 区块链 供应链金融 2018年5月,公司全资子公司设立广电运通区块链科技有限公司,以区块链技术等为技术立足点,快速进入“区块链...

  • Elasticsearch from+size 分页

    from+size 实现分页 "浅"分页可以理解为简单意义上的分页。它的原理很简单,就是查询前20条数据,然后截断前10条,只返回10-20的数...

  • elasticsearch 常见面试问题整理(1)

    Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法? 1、关闭缓存 swap;2、堆内存设置为:Min(节点内存/2, ...

  • 大数据Apache Spark是什么?

    Apache Spark是什么? Spark是一个用来实现快速而通用的集群计算的平台。扩展了广泛使用的MapReduce计算模型,而且高效地支持...

  • Storm Trident介绍

    一、概述 Storm Trident中的核心数据模型就是“Stream”,也就是说,Storm Trident处理的是Stream,但是实...

  • 大数据生态圈

    Hadoop 是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。 Hadoop 的核心是 HDFS 和 Mapredu...

  • Hbase物理模型架构体系

    hbase工作流程 HRegionServer负责打开region,并创建HRegion实例,它会为每个表的HColumnFamily(用户创建...

  • Spark特性

    Spark通过在数据处理过程中成本更低的洗牌(Shuffle)方式,将MapReduce提升到一个更高的层次。利用内存数据存储和接近实时的处理能...

  • Nginx工作原理

    Nginx由内核和模块组成。 Nginx本身做的工作实际很少,当它接到一个HTTP请求时,它仅仅是通过查找配置文件将此次请求映射到一个locat...

专题公告

Linux,hive,Hadoop,Storm,Spark,日志,任务等