论文阅读:Heavy-Hitter Detection Entirely in the Data Plane

摘要:

识别“heavy hitter”数据流或数据平面中具有大流量的数据流对于多种应用(例如,知道流量大小的路由,DoS检测和流量工程)来说非常重要。

然而,数据平面中的测量受到线速处理10-100Gb / s)和交换硬件中有限内存需求的限制。

提出了HashPipe,这是一种使用新兴的可编程数据平面的heavy hitter检测算法。HashPipe实现了哈希表的管道,该哈希表保留了重流的计数器,同时随着时间的推移逐出了较轻的计数器。

背景/问题:

许多网络管理应用程序可以从发现对链路贡献大量流的流量中受益:例如,减轻链路拥塞,规划网络容量,检测网络异常和攻击,或缓存转发表条目。

此外,在较小的时间尺度上(与流量变化相比较)识别此类“heavy hitter”可以实现重流的动态路由和动态流量调度。人们希望始终在网络中的所有交换机上运行重流监视,以快速响应短期流量变化。

在交换机中处理数据包时,是否可以识别属于高流量的数据包,以便交换机可以对其进行特殊处理?现有的监视heavy hitter的方法很难以可接受的开销获得合理的准确性。

NetFlow的形式进行数据包采样在软件中处理采样数据包的CPU和带宽开销使其无法以足够高的速率进行采样。而另一种方法,sketch需要大量的内存开销来检索heavy hitter

新兴的可编程交换机使我们不仅可以进行采样,哈希和计数,还为在交换机上运行新颖算法提供了机会。

当在10-100个端口上以每个端口10-100 Gbps的线速运行时,可以对这些交换机进行编程,以维持多个数据包的状态,例如,将流标识符作为keys带着计数器。

但是交换机受到保持高分组处理吞吐量的需求的约束:

  • 确定性的小时间预算(1 ns),用于在每个阶段处理状态和处理数据包
  • 每个阶段对内存存储状态的访问次数有限,通常只有一次readmodify-write
  • 每个阶段可用的内存量有限
  • 需要仅将大部分数据包通过管道移动一次,以避免停顿和降低吞吐量

解决办法:

我们提出了HashPipe,该算法可在可编程交换机的功能和约束范围内以高精度跟踪最重的k个流量。

HashPipe在哈希表的流水线中维护流标识符(“键”)和交换机中的重流计数。

当数据包散列到流水线第一级中的某个位置时,如果有命中(或空插槽),则将更新(或初始化)其计数器。如果有遗漏,则以现有密钥为代价插入新密钥 。

在所有下游阶段,随包一起携带刚刚收回的物品的密钥和数量,在哈希表中查找的与携带的密钥之间,具有较大计数的密钥将保留在哈希表中,而另一个密钥则与数据包一起携带到下一个阶段,或者如果密钥被携带,在最后阶段则将从交换机中完全删除数据包。

因此,HashPipe使用流水线操作对哈希表中的多个位置进行采样,并使用较轻的键代替较重的键,从而在有限的可用内存中“清除”沉重的键,并且每个阶段仅更新一个位置。

Hashpipe算法实现细节:

节省空间:

要跟踪k个最重的项目,节省空间的方法是使用一个具有m个(为O(k))插槽的表,每个插槽都标识一个不同的流的密钥及其计数器



当数据包到达时,如果表中还没有对应的流,并且表中还有剩余空间,则空间节省功能将插入新的流,计数为1。如果表中存在流,算法将更新相应的流计数器。但是,如果表已满,并且在表中找不到流,则该算法将表中具有最小计数器值的流条目替换为传入数据包的流,并递增此最小值计数器。

最小值采样:

我们要做的是查看随机选择的计数器的较小的恒定数量d的最小值,而不是整个表,将每个数据包的最坏情况的存储器访问次数限制为较小的固定常数d。

算法2中显示了修改后的版本HashParallel。


与算法1相比,主要变化在于检查了一组表插槽(在查找或更新任何键时),该表插槽现在是通过对表哈希进行哈希处理而获得的d个插槽集合,使用d个独立哈希函数的传入密钥。

实际上,我们对表进行采样以使用几个位置来估计最小值。但是,只有d个插槽的最小值可能会与整个m个插槽表的最小值相距甚远。最小值的设定值可能会影响有用的错误保证,以节省空间。

哈希表的多个阶段:

为了减少对内存的读取次数,以方便以线路速率进行操作,我们将计数器表T拆分为d个不相交的表,并且每个表正好读取一个插槽。

由于不同的数据包可以同时访问不同的表,因此该设计可以使对d表的内存访问的流水线化,但是,数据包可能需要通过此流水线两次:一次确定d个时隙中最小值的计数器,第二次更新该计数器。

前馈包处理:

现在,我们使用两个关键思想来减轻通过交换管道多次处理数据包的需求。

首先,跟踪滚动最小值:通过将计数器和密钥作为包元数据在管道中移动,我们跟踪当数据包穿过管道时到目前为止看到的最小计数器值(及其密钥)。

其次是始终插入第一阶段:如果在管道的第一个阶段中找不到传入密钥,则没有关联的计数器值可与该表中的密钥进行比较。在这里,我们选择始终在第一个阶段插入新的流,并将现有的密钥和计数器逐出数据包元数据,在该阶段之后,分组可以以上述通常的方式跟踪后续阶段的最小滚动。

其实整个HashPipe的结构都可以用图三的算法表示出来。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,393评论 5 467
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,790评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,391评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,703评论 1 270
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,613评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,003评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,507评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,158评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,300评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,256评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,274评论 1 328
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,984评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,569评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,662评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,899评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,268评论 2 345
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,840评论 2 339

推荐阅读更多精彩内容