Kafka 2017技术峰会摘要(流计算分类)

下载全部视频和PPT,请关注公众号(bigdata_summit),并点击“视频下载”菜单

Building Event-Driven Services with Stateful Streams

by Benjamin Stopford, Engineer, Confluent
video, slide
Event Driven Services come in many shapes and sizes from tiny event driven functions that dip into an event stream, right through to heavy, stateful services which can facilitate request response. This practical talk makes the case for building this style of system using Stream Processing tools. We also walk through a number of patterns for how we actually put these things together.

下面的内容来自机器翻译:
事件驱动服务具有许多形式和尺寸,从小事件驱动的功能进入事件流,直到沉重,有状态的服务,这可以方便请求响应。这个实际的谈话使得使用流处理工具来构建这种类型的系统成为可能。我们也通过一些模式来解释我们如何将这些东西放在一起。

Building Stateful Financial Applications with Kafka Streams

by Charles Reese, Senior Software Engineer, Funding Circle
video, slide
At Funding Circle, we are building a global lending platform with Apache Kafka and Kafka Streams to handle high volume, real-time processing with rapid clearing times similar to a stock exchange. In this talk, we will provide an overview of our system architecture and summarize key results in edge service connectivity, idempotent processing, and migration strategies.

下面的内容来自机器翻译:
在Funding Circle,我们正在与Apache Kafka和Kafka Streams建立一个全球性的贷款平台,以处理大批量,实时的处理,快速的结算时间与证券交易所类似。在本次演讲中,我们将概述我们的系统架构,并总结边缘服务连接,幂等处理和迁移策略的关键成果。

Fast Data in Supply Chain Planning

by Jeroen Soeters, Lead Developer, ThoughtWorks
video, slide
We are migrating one of the top 3 consumer packaged goods companies from a batch-oriented systems architecture to a streaming micro services platform. In this talk I’ll explain how we leverage the Lightbend reactive stack and Kafka to achieve this and how the 4 Kafka APIs fit in our architecture. Also I explain why Kafka Streams <3 Enterprise Integration Patterns.

下面的内容来自机器翻译:
我们正在将三大消费品公司之一从批处理系统架构迁移到流式微服务平台。在这个演讲中,我将解释我们如何利用Lightbend反应堆和Kafka来实现这个目标,以及4个Kafka API如何适应我们的架构。另外我解释了为什么Kafka Streams <3企业集成模式。

Kafka Stream Processing for Everyone with KSQL

by Nick Dearden, Director of Engineering, Confluent
video, slide
The rapidly expanding world of stream processing can be daunting, with new concepts (various types of time semantics, windowed aggregates, changelogs, and so on) and programming frameworks to master. KSQL is a new open-source project which aims to simplify all this and make stream processing available to everyone.

下面的内容来自机器翻译:
随着新概念(各种类型的时间语义,窗口聚合,更新日志等)和编程框架的掌握,流处理的迅速发展的世界将变得艰巨。 KSQL是一个新的开源项目,旨在简化所有这些工作,并为每个人提供流处理。

Portable Streaming Pipelines with Apache Beam

by Frances Perry, Software Engineer, Google
video, slide
Much as SQL stands as a lingua franca for declarative data analysis, Apache Beam aims to provide a portable standard for expressing robust, out-of-order data processing pipelines in a variety of languages across a variety of platforms. By cleanly separating the user’s processing logic from details of the underlying execution engine, the same pipelines will run on any Apache Beam runtime environment, whether it’s on-premise or in the cloud, on open source frameworks like Apache Spark or Apache Flink, or on managed services like Google Cloud Dataflow. In this talk, I will:

Briefly, introduce the capabilities of the Beam model for data processing and integration with IO connectors like Apache Kafka.
Discuss the benefits Beam provides regarding portability and ease-of-use.
Demo the same Beam pipeline running on multiple runners in multiple deployment scenarios (e.g. Apache Flink on Google Cloud, Apache Spark on AWS, Apache Apex on-premise).
Give a glimpse at some of the challenges Beam aims to address in the future.

下面的内容来自机器翻译:
就像SQL作为声明性数据分析的通用语言一样,Apache Beam旨在提供一种便携式标准,用于在各种平台上以各种语言表示健壮的,无序的数据处理管道。通过将用户的处理逻辑与基础执行引擎的细节完全分离,相同的管道将运行在任何Apache Beam运行时环境(无论是内部部署还是云中),Apache Spark或Apache Flink等开放源代码框架上,还是像谷歌云数据流管理的服务。在这个演讲中,我会:

简而言之,介绍Beam模型的功能,用于数据处理和IO连接器(如Apache Kafka)的集成。
讨论Beam提供的有关便携性和易用性的好处。
在多个部署场景(例如,Google Cloud上的Apache Flink,AWS上的Apache Spark,Apache Apex内部部署)上演示运行在多个运行器上的相同Beam管道。
瞥见梁在未来要解决的一些挑战。

Query the Application, Not a Database: “Interactive Queries” in Kafka’s Streams API

by Matthias Sax, Engineer, Confluent
video, slide
Kafka Streams allows to build scalable streaming apps without a cluster. This “Cluster-to-go” approach is extended by a “DB-to-go” feature: Interactive Queries allows to directly query app internal state, eliminating the need for an external DB to access this data. This avoids redundantly stored data and DB update latency, and simplifies the overall architecture, e.g., for micro-services.

下面的内容来自机器翻译:
Kafka Streams允许在没有群集的情况下构建可扩展的流式应用程序。这种“Cluster-to-go”方法通过“DB-to-go”功能进行扩展:交互式查询允许直接查询应用程序内部状态,无需外部数据库来访问这些数据。这避免了冗余存储的数据和数据库更新等待时间,并且简化了整体架构,例如对于微服务。

Real-Time Document Rankings with Kafka Streams

by Hunter Kelly, Senior Software/Data Engineer, Zalando
video, slide
The HITS algorithm creates a score for documents; one is “hubbiness”, the other is “authority”. Usually this is done as a batch operation, working on all the data at once. However, with careful consideration, this can be implemented in a streaming architecture using KStreams and KTables, allowing efficient real time sampling of rankings at a frequency appropriate to the specific use case.

下面的内容来自机器翻译:
HITS算法为文档创建分数;一个是“喧嚣”,一个是“权威”。通常这是作为批处理操作完成的,一次处理所有的数据。然而,经过慎重的考虑,这可以在使用KStreams和KTables的流式架构中实现,从而以适合特定用例的频率对排名进行高效的实时采样。

Streaming Processing in Python – 10 ways to avoid summoning Cuthulu

by Holden Karau, Principal Software Engineer, IBM
video, slide
<3 Python & want to process data from Kafka? This talk will look how to make this awesome. In many systems the traditional approach involves first reading the data into the JVM and then passing the data to Python, which can be a little slow, and on a bad day results in almost impossible to debug. This talk will look at how to be more awesome in Spark & how to do this in Kafka Streams.

下面的内容来自机器翻译:
<3 Python&想要处理来自Kafka的数据?这个演讲将看看如何使这个真棒。在许多系统中,传统的方法是首先将数据读入JVM,然后将数据传递给Python,这可能会稍微慢一点,而在糟糕的一天中,几乎不可能调试。这个演讲将讨论如何在Spark中更加棒,以及如何在Kafka Streams中做到这一点。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,607评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,047评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,496评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,405评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,400评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,479评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,883评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,535评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,743评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,544评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,612评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,309评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,881评论 3 306
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,891评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,136评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,783评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,316评论 2 342

推荐阅读更多精彩内容

  • 这个算是临的第一张风景速写了,起形之后唯一的工具就是黑色圆珠笔。 这是什么风景区来着?(疯狂挠头中……)
    奈何zh阅读 261评论 4 3
  • 梅父具新笋,邀我至农家。 绿树村旁接,桃花户外迎。 此间真好客,车至笑声盈。 腊肉新焙酒,清油老母鸡, 新摘园中翠...
    飞哥判案阅读 411评论 0 4
  • 我已经冷静, 不再是我。 我轻巧的走在路上, 雨已过。 可是, 我走到了路径分叉的那个坏地方, 我难以抉择, 即使...
    柳川阅读 335评论 0 0
  • 人过40,国家突然放开二孩政策,单位里一批70后男男女女难掩兴奋,“准备生吗?”已经取代“吃了吗?”成为一...
    湖田瓦瓦阅读 297评论 0 0