分布式消息系统Apache Kafka那些事儿

Apache Kafka是分布式发布-订阅消息系统，最初由LinkedIn开发，之后成为Apache项目的一部分。Apache Kafka的创始人之一Jay Kreps最近接受了媒体采访，对Kafka做了深入浅出的分析，包括和其他同类项目的对比、存储原理和格式、实现语言等等。

** Kafka解决了什么问题？**

Kafka是一个数据流的分布式存储系统。它允许你发布或者订阅数据流。它是围绕着一个附加的持续的日志文件的概念建立起来的——发布者把数据添加到这个日志文件中，消费者则订阅它的变化。也许最重要的是，它可扩展性真的很棒，所以像Linkedin或Netflix或Uber这样拥有大量数据的公司也可以用它作为数据流的中央枢纽。

** 为什么RabbitMQ、ActiveMQ等类似开源项目对这个问题不那么管用？ **

Kafka有一些与众不同的东西：

它是在现代分布式系统的基础上建立起来的，易于复制、容错和分区。你可以把Kafka想象成是一个cluster，而不是一个各自独立的broker的集合。这会影响到从你如何管理它到程序如何执行的所有事情。

Kafka在保存数据上做得很好。Kafka上的数据常常被保存并可以被重复读取。

Kafka比传统的消息系统都要快，因此它很适合真正的大容量数据流，比如日志记录的使用情况，或者传感器数据的大规模数据流。

Kafka被设计为分布式系统核心原语的上一层来支持其流处理过程。这就是为什么Kafka被如此广泛的同Spark Streaming或Storm一起使用的原因。

** 以哪种类型的结构保存消息，又以什么格式来保存？**

Kafka中的消息或记录只是一个键-值对，这里键和值分别是一些字节的字符串。

Kafka提供了一个抽象的“主题”概念，这个主题被分成一个或多个(通常是很多个)分区，并被分散在一个节点组成的丛簇中。主题是一种记录的反馈。应用向主题公开记录，然后记录的键决定了这些记录应该位于主题的哪个分区。每个分区都在多台机器上复制用于容错。

Kafka提供的一个核心概念(也是其实现过程中使用的数据结构)是写前（write ahead）日志文件。这个日志文件只是一个保存在磁盘上的将要写入到cluster的记录的有序序列。每一个记录都被分配了一个称为偏移量的序列号。该偏移量意味着日志文件中的位置。

一个应用使用分区，可以被想象成拥有一个被偏移量标记的在日志文件上的位置，这意味所有的记录都可以被提前读取，而没有一个被滞后。这个应用控制着位置，可以持续地向前读取，或者一段时间后返回重新读取。

** 如果将消息保存在磁盘中而不是内存中，Kafka如何轻易地处理每秒数以千计的消息呢？**

精心设计！根据我们的观察，并没什么特殊的原因。我们想要的日志文件在线性写入的情况下并不能像底层文件系统那么快。底层文件系统在旋转磁盘上有几百MB/s的速度，在固态磁盘上有GB/s级的速度。为了达到这么个速度，Kafka引入了一个很好的处理办法，它对大的线性写入同时进行很多个小的批量写入。这种批量写入发生在消费者使用时，发生在复制时，也发生在操作系统本身。

我认为底层结构领域的设计在这方面是不同的。应用程序开发者都被警告过过早进行优化的危害，但是对于底层结构，我认为需要在设计阶段就开始考虑性能。造成这个不同的原因是底层结构的基本限制一开始就是知道的，而且通常系统设计不是很灵活，所以如果你开始的时候忽略了性能的话，那就很难在你已有的设计基础上进行返工优化。

** Kafka提供了什么保障？在什么情况下信息可以被丢弃？**

Kafka使得那些写入能够以相同的顺序在N个设备中被复制(N是你选择的复制次数)，所以只要其中的一个设备的复制还存在的，你的写入就不会丢失。

与消费者控制他们自己偏移量的方式相结合，这意味着“至少一次”交付模式。

** 你提到了Kafka流，能简单解释一下它是什么以及它为什么有用吗？ **

Kafka流是我们正在使用的Kafka的流处理层。它与我们现有的流处理框架有一点不同——它更专注于建立流媒体应用，一种MapReduce的实时版本。
我们将在三月初做一个预发行版。
结合我们在Kafka Connect上所做的工作，我们认为这将使得Kafka成为一个真正吸引人的流数据平台。

** 为什么选择用Java来实现Kafka？有没有想过用使用其它的编程语言？ **

我们在JVM语言方面经验丰富，知道可能用它建立一个快速可靠的底层结构——而且它使用起来比C语言或C++更为方便。

** 除了Erlang，还有一些语言像Go和Clojure都在一开始就添加了很好的并发模块和semantics。你是否觉得一个具有优秀并发模块语言对普通的开发者也是很有用，而不仅仅是只对框架实现有用吗？**

在这里我想点评一下网络协议中端对端原理这类东西的命运。基本上你在终端上需要解决并发问题都是在Higher level的，而这会导致Lower-level的原语产生冗余。我看到的现象是每一种语言都试图为多核程序提供内置的原语。但是不像Erlang，我认为它们中的大多数都忽视了分布式计算的问题。

而发生改变的是，现代编程总是在一些在higher level引入了并发模块的框架下进行。整个苹果和安卓的堆栈就是这种框架的例子，它们具有大量的微服务框架，以及像Spark或者Kafka Streams这样的东西。这些higher level的框架能够很好地工作，因为他们可以对环境进行假设，而在语言层上这是不可能的。例如，他们中许多都可以引入了一个模型，这个模型可以同时解决分散在一个计算机的多个CPU上的计算，也可以解决分散在多个计算机上的计算。

** 对于我们这些想要开始学习分布式系统的人，你有什么建议吗？有没有什么书籍、论文或者代码库切实地帮助你你实现和设计了Kafka？**

我认为Martin Kleppman的Designing Data Intensive Applications这本书是一个很好的开始。我只读过其中的部分章节，但它是我见过的关于分布式系统的最容易理解的介绍。遗憾的是，目前12个章节中，只有9个章节是可以得到的，所以我们都要催催他赶紧完成这本书。

还有一本很好的你现在就可以买到的教科书是Introduction to Reliable and Secure Distributed Programming。这本书并不是非常适合学习，但它比其它教科书要好得多，其它教科书太可怕了。虽然分布式系统的研究已经有几十年了，但它却不是真的被广泛使用。它好像形成了一种以与主流应用相脱节而自豪的文化。比如说那本教科书，它用一百多页的篇幅介绍不同的可能的通信原语，谈论它们的性能，却没有涉及到如何将他们与实际的主流网络协议(比如UDP和TCP)连接起来，这让我很不解。

不过好在如今有了数以百计的开源分布式系统可以应用，所以你可以从它们的设计和实现过程中学到很多。

最后编辑于：2017.12.03 04:22:40

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,324评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,303评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,192评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,555评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,569评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,566评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,927评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,583评论 0赞 257
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,827评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,590评论 2赞 320
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,669评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,365评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,941评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,928评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,159评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,880评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,399评论 2赞 342

分布式消息系统Apache Kafka那些事儿

推荐阅读更多精彩内容