限流算法比较与实现

API或者微服务一般来说有个QPS或TPS的设计值,超过这个设计值响应性能会快速下降。假如服务的某个调用方在短时间内发送大量请求就会导致服务整体性能下降, 其他调用方也会受到影响。一个解决办法就是做流量控制将超过限制的调用方限流或者拒绝响应以保护服务。这就需要采用限流算法。举个例子, 某个写入接口对单个用户的操作上限是10次/秒, 假如用户操作频率大于上限就要触发限流, 限流后的处理方式可以有很多比如放到队列里排队等待执行或者直接拒绝。

本文主要介绍几种限流算法的思路以及具体实现方式,并进行对比。

Fixed-Window算法

这个算法的思路是比较简单的, 考虑一个固定长度的时间窗口,比如10s、1min、1h等, 在这个时间窗口内统计请求次数, 但请求次数超过阈值就触发限流。这个算法有两点第一时间窗口的长度是固定的并对应一个计数器, 第二每个时间窗口开始时计数器清零。

用redis结合伪码来描述这个算法如下:(实现限流10次/1s)

count = GET Key  # 获取某个用户(Key)的计数值

# 如果计数值大于10(阈值)就限流
IF count != NULL AND count > 10 THEN
    ERROR "too many requests per second"
ELSE  # 如果没有超过阈值
    value = INCR(Key)  # 计数值增加1
    # 如果计数值是1(表示这是一个新的窗口)
    # 那么设置过期时间为1s, 这里体现了窗口是固定长度的
    IF value == 1 THEN  
        EXPIRE(Key,1)  
    END
END

上面的伪码可以很好的说明算法的思路,但是实际使用的过程中却不能这样写代码, 因为INCR跟EXPIRE在这里不是一个原子操作, 假如INCR成功了但是EXPIRE失败了那么这个用户请求量超过阈值后就再也不能正常请求了。

必须采用原子操作的另外一个原因是避免竞争, 整个操作可以看做GET-then-INCR,因为服务是分布的所以多个实例会GET到相同的值导致限流失效。

为了实现原子操作可以使用redis结合lua代码:(实现限流10次/1s)

local count
local limit = ARGV[1]
count = redis.call("incr",KEYS[1])
if tonumber(count) == 1 then
    redis.call("expire",KEYS[1],1])
end
return count<limit 

这个算法的优点是:

  • 实现简单
  • 时间窗口固定, 每个窗口开始时计数为零,这样后面的请求不会受到之前的影响,做到了前后请求隔离

缺点:

  • 上面优点中的第二点其实也是缺点, 因为两个时间窗口之间没有任何联系, 所以调用者可以在一个时间窗口的结束到下一个时间窗口的开始这个非常短的时间段内发起两倍于阈值的请求。所以Fixed-Window算法无法限制窗口间突发流量
  • 无法平滑限流, 比如限流10万次/小时, 那调用者可以在1s内调用10万次而不触发限流

Fixed-window-elastic

Fixed-window-elastic算法其实是Fixed-Window的变种, 主要是为了解决Fixed-Window无法限制突发流量的缺点。

Fixed-window-elastic算法也是在时间窗口内采用计数器来实现限流,但不同的是这个算法的时间窗口不是固定时间刷新一次而是每次计数后都刷新一次。 对比一下:

  • Fixed-Window算法的时间窗口固定时间过期一次, 即计数器固定时间失效
  • Fixed-window-elastic算法时间窗口的过期时间在计数后顺延一次, 即计数器不会在固定时间失效

还是使用redis, 给出Python代码:(实现限流10次/1s)

count = redis_client.incr(key)
redis_client.expire(key, 1)
if count > 10:
    return "too many requests"

代码更加简单了, 但是这里incr跟expire没有做成原子操作,为什么呢?因为expire失败是小概率事件,既然每次都要expire那偶尔一次失败是不会造成灾难性后果的,对吗?

这个算法的优点是:

  • 还是实现简单
  • 因为窗口顺延所以可以抵御窗口间突发流量(对比Fixed-Window)

缺点:

  • 优点一样是缺点, 假如限流10万次/小时, 如果某个调用者在前10分钟调用了10万零1次那么他必须再等待1小时才能发起下一次正常请求。所以没有做到前后请求隔离
  • 无法平滑限流

Moving-Window

这个算法的思路是为每个调用方维护一个长度为limit的先进先出队列, 将每次请求的时间戳放到队列中, 比如阈值是10次/1s 那么limit = 10, 每次请求时取出队列头部(下标为limit -1 )的时间戳timestamp1, 假如timestamp1存在并且本次请求的时间戳减去timestamp1小于等于时间窗口长度expiry(单位为秒, 时间戳的单位也是秒), 比如阈值是10次/1s, 那么expiry=1, 那么说明在一个时间窗口长度内请求数量超过了阈值需要限流。否则就把这次请求的时间戳放入队列中, 并更新队列过期时间。

结合redis给出lua代码:(实现限流10次/1s)

lcoal limit = 10
local entry = redis.call('lindex', KEYS[1], limit - 1)
local timestamp = tonumber(ARGV[1]) # ARGV[1]是当前请求时间戳
local expiry = 1
if entry and tonumber(entry) >= timestamp - expiry then
    return false
end
redis.call('lpush', KEYS[1], timestamp)
redis.call('ltrim', KEYS[1], 0, limit - 1)
redis.call('expire', KEYS[1], expiry)
return true

Fixed-window-elastic与Fixed-Window其实是在抵御窗口间突发流量与前后请求隔离之间做了选择, 选择了前者就必须放弃后者。 但是Moving-Window可以同时实现抵御窗口间突发流量前后请求隔离,为什么呢?

来看这个算法的两个要点:

  • 每次正常请求后时间窗口的过期时间顺延一次,时间窗口是滑动的所以可以抵御窗口间突发流量
  • 虽然时间窗口的长度不是固定的但是队列的长度是固定,所以可以做到前后请求隔离

这个算法的缺点是:

  • 占用的内存大, 举个例子限流10万次/小时那么就需要维护一个长度为10万的队列
  • 无法平滑限流
  • 时间复杂度高,这是相对于Fixed-window-elastic与Fixed-Window来说的, 如果服务并发大,那么redis可能会成为瓶颈

Token Bucket

这个算法的思路很简单, 想象有一个桶用来存放令牌,并且以恒定的速率向桶内放入令牌, 每次请求时就取出一块令牌, 如果桶内没有令牌了那么就表示这个请求需要被限流。这个桶的容量是有限的, 桶满后新的令牌不会被放入。

实现这个算法的代码就有点复杂了,首先不能真的为每个用户设置一个线程去放入令牌, 这是不可能做到的。所以采用记录上次添加令牌的时间跟当前请求时间相减算出应该添加的令牌数

还是采用redis给出lua代码:

local key = KEYS[1]
local intervalPerToken = tonumber(ARGV[2])
local currentTime = tonumber(ARGV[1])
local maxToken = tonumber(ARGV[3])
local initToken = tonumber(ARGV[4])
local maxInterval = tonumber(ARGV[5])
local tokens
local bucket = redis.call("hmget", key, "lastTime", "lastToken")
local lastTime = bucket[1]
local lastToken = bucket[2]
if lastTime == false or lastToken == false then
    tokens = initToken
    redis.call('hset', key, 'lastTime', currentTime)
else
    local thisInterval = currentTime - tonumber(lastTime)
    if thisInterval > maxInterval then
        tokens = initToken
        redis.call('hset', key, 'lastTime', currentTime)
    elseif thisInterval > 0 then
        local tokensToAdd = math.floor(thisInterval / intervalPerToken)
        tokens = math.min(lastToken + tokensToAdd, maxToken)
        redis.call('hset', key, 'lastTime', lastTime + intervalPerToken * tokensToAdd)
    else
        tokens = lastToken
    end
end
if tokens == 0 then
    redis.call('hset', key, 'lastToken', tokens)
    return false
else
    redis.call('hset', key, 'lastToken', tokens - 1)
    return true
end

其中

  • key
  • currentTime: 当前请求时间 ms
  • intervalPerToken: 每个令牌之间的间隔
  • maxToken: 桶内最大的令牌数量
  • initToken: 初始的令牌数量
  • maxInterval: 空闲这个时间后恢复到初始令牌数量 ms

这六个参数都是运行lua脚本时传入的

注意0 < initToken <= maxToken

这算法的优点是:

  • 可以抵御突发流量, 因为桶内的令牌数不会超过给定的最大值,当然在设置时initToken必须小于等于maxToken
  • 可以做到前后流量隔离, 因为令牌最小值是0
  • 可以做到平滑限流, 因为令牌是匀速放入的

缺点:

  • 相对复杂

总结

来个表总结下:

算法 隔离流量 限制突发流量 平滑限流 时间复杂度 空间复杂度
Fixed-Window Yes No No
Fixed-window-elastic No Yes No
Moving-Window Yes Yes No
Token Bucket Yes Yes Yes

总结完发现上面的优缺点分析犯了一个错误: 没有指明具体的使用场景。 不能平滑限流一定是缺点吗? 不能限制突发流量一定是缺点吗?能隔离前后流量一定是优点吗?

不一定!对吗?

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,905评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,140评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,791评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,483评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,476评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,516评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,905评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,560评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,778评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,557评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,635评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,338评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,925评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,898评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,142评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,818评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,347评论 2 342

推荐阅读更多精彩内容

  • 缓存 缓存比较好理解,在大型高并发系统中,如果没有缓存数据库将分分钟被爆,系统也会瞬间瘫痪。使用缓存不单单能够提升...
    阿斯蒂芬2阅读 12,116评论 1 28
  • 摘要:在开发高并发系统时有三把利器用来保护系统:缓存、降级和限流。而有些场景并不能用缓存和降级来解决,因此需有一种...
    落羽成霜丶阅读 2,147评论 0 18
  • 聊聊高并发系统限流特技-1来自开涛的博客 在开发高并发系统时有三把利器用来保护系统:缓存、降级和限流。缓存的目的是...
    meng_philip123阅读 6,617评论 1 20
  • 最近一直都在研究压力测试客户端的问题,如果突破客户端压力测试线程,端口等问题,如果服务器端处理网络请求处理不过来,...
    望月成三人阅读 8,629评论 1 25
  • 曾经在一个大神的blog里看到这样一句话:在开发高并发系统时,有三把利器用来保护系统:缓存、降级和限流。那么何为限...
    Johnsonxu阅读 1,979评论 0 4