现在生活中,秒杀已经随处可见,尤其是在电商行业中。
这里,我将以自己的实际生活情况,学校图书馆抢购书包柜为例,讲解一下秒杀系统。
秒杀系统分析
- 秒杀的场景决定了秒杀是一场速度的比拼,即“手快有、手慢无”。活动开始后,大家都疯狂的点击鼠标。想在第一时间将书包柜抢到,完成预订。因此秒杀活动开始的一瞬间会有大量的流量涌入,几倍、甚至于十几倍的流量对系统的冲击不可谓不大。如果系统没有足够的capacity或应对措施,很可能就被瞬时高流量给压垮了。
- 突如其来的高流量,给系统各个模块都来了一连串的压力,系统可能会因此变慢,而且可能会彼此影响,影响可用性。例如需要多次读写数据库,随着并发的压力逐渐增大,数据库更新的性能是逐渐下降的,进而反馈到用户的可能就是整个秒杀系统流程性能差、响应慢。而面对响应慢的系统,很多用户可能采取的措施就是反复刷新,多次尝试,这无疑又增大了对系统的压力。
上述种种给用户带来的往往是体验上的痛苦。如:网站响应慢,点击预订按钮没反应。好不容易可以操作了,却发现秒杀活动已经结束。
在这里,我不得不吐嘈一下学校的书包柜预订系统,大学三年来,从来就没有正常运行过,一到抢购的那天深夜12点,大家做的事就是等待一分钟内就崩溃的系统被修复,而且因为不知道它哪一秒被修复好,很多人会等一夜。
基于以上秒杀场景下的痛点我在设计秒杀排队系统在设计时主要考虑以下几点:
- 限流:当秒杀活动开始后,只有少部分消费者能抢购到秒杀商品,意味着其实大部分用户的流量传达到后台服务后都是无效。如果能引导这大部分的流量,不让这大部分的流量传达到后台服务,其实对我们系统的压力就很小了。因此设计思路之一就是,仅让能成功抢购到商品的流量(可以有一定余量)进入我们的系统
- 削峰:进入系统的有效流量虽然总量不一定是很大的,但却是在很短的时间内涌入的,因此会存在很高的瞬时流量峰值。总量相同的流量在1秒钟进入系统,和在10分钟均匀地进入系统,对系统的冲击是相差很大的。高峰值的流量往往能将系统压垮。因此另一个设计思路是,如何将进入系统的瞬时高流量拉平,使得系统可以在自己处理能力范围内,将所有抢购的请求处理完毕。
- 异步处理:传统的系统对于请求是同步处理的,即收到请求后立即处理并把结果返回给用户。我们的系统有了削峰的设计后,请求不是被立刻处理的,因此就要求我们能将同步的服务改造成异步的。
- 可用性:我们设计时始终把系统的可用性放在重要的位置,针对系统可能出现的各种状况,都尽最大程度地保证高可用。
以下是我的设计思路:
代码部分
- 对于客户端请求进行的初步处理,使用PHP代码进行编写。
- 对客户端请求进行真正处理,即给用户随机分配箱子的代码,使用JAVA进行编写。并使用队列数据结构和多线程进行处理。
- 对于真正进入Java进行处理的请求,之前我们需要在PHP部分进行两次控制。第一次是随机引导大部分的流量,不让其进入后台服务,并对失效的请求返回提示信息,提示信息为:请稍后重新刷新。第二次是查看书包柜是否还有剩余,若没有剩余,就对此请求返回提示信息,提示信息为:书包柜已抢购完毕。
- 为了提高对数据库的访存速度,借助memcached key-value内存存储系统。将数据库的存储信息全部预存到memcached中。在memcached中数据的读取与存储速度远远高于mysql数据库。
- 数据库表结构,为了简化只取两列,表 箱子:ID和箱子具体信息。在本次讨论中,ID取1~10000,代表有10000个箱子。预订表: ID和用户信息。
- 在第二次控制中,如何查看书包柜是否还有剩余,这是一个问题。显然,如果每次都去读后台数据库,那么我们讨论的秒杀就没有意义了。我们可以在memcached设置一个标志位,初始值为0,表示箱子还有剩余,只有当书包柜没有剩余时,更新此标志位的值为1。在第二次控制的时候,查看书包柜是否还有剩余,我们只需对memcached中标志位进行读取判断即可。
实际执行过程
- 为了限流,当用户在页面点击预订按钮后,请求首先进入PHP代码处理,PHP代码第一部分用于随机控制真正进入Java代码处理的请求。
对于不能进入Java的请求,在PHP代码里返回给用户提示信息,提示其重新发起请求。 - 随机限流之后,对memcached中标志位进行读取进行第二次控制,若为0,则将此请求放行,进入Java代码部分,若为1,则代表书包柜已被抢购完毕,PHP代码返回给用户提示信息,提示信息为:书包柜已抢购完毕。
- 经过PHP两次控制之后,真正能被处理的请求进入Java代码处理部分。在Java代码中,使用一个队列来存储请求。当队列长度超过一定值后,就会对之后进来的请求Java代码进行拒绝,并返回给PHP 代码部分,PHP代码部分再将拒绝结果返回给客户端,要求其稍后重试。在JAVA代码部分,使用多线程对请求进行处理,以提高速度。
- 为了进一步提高处理速度,可以采用多个队列。每个队列分配一定范围内的ID任务,如第一个队列负责1~2000的书包柜分配,第二个队列负责2001~4000的书包柜分配任务,以此类推。每次进入java请求,随机分配其进入任一队列,然后由此队列按其任务顺序分配书包柜。那么,当有多个队列时,该如何设置memcached中的标志位来表示书包柜是否抢购完毕呢?
首先,初始值仍设为0,代表书包柜还有剩余。对于每个队列,当任务均已执行完毕,如第一个队列1~2000的书包柜均已分配完毕,则对memcached中的标志位进行一次更新加1,当标志位为5时,代表书包柜分配完毕。在PHP的第二次控制中,对memcached中标志位进行读取,若为0,则将此请求放行,进入Java代码部分,若为5,则代表书包柜已被抢购完毕,PHP代码返回给用户提示信息,提示信息为:书包柜已抢购完毕。在执行过程中,很可能某个的任务提前完成了,这时就可以将这个队列消除。