缓存穿透、缓存击穿、缓存雪崩区别和解决方案
有很多解决高并发的应用场景中都会使用memcache\redis缓存来解决响应慢的问题,但是缓存也不是万能的,在使用方面有很多的考虑的问题,把缓存比喻成防弹衣,但是如果你没有穿好这件防弹衣会适得其反,下面我根据自己的理解就展开来谈谈。
在高并发场景下有一个常常被忽略的一个地方,读多还是写多,读多写少用缓存,写多读少用队列。
为什么要用缓存?为了系统的高性能,在每个系统的性能指标中有两个重要的点,一个是性能最佳点和性能最大值,超过最大融载值就走向系统崩溃的边缘了。
缓存穿透
缓存穿透是指缓存和数据库中都没有的数据,而用户不断发起请求,特别大不存在的数据。这时的用户很可能是攻击者,攻击会导致数据库压力过大。
解决方案:
1.在服务器端,接收参数时业务接口中过滤不合法的值,null,负值,和空值进行检测和空值。
2.bloom filter:类似于哈希表的一种算法,用所有可能的查询条件生成一个bitmap,在进行数据库查询之前会使用这个bitmap进行过滤,如果不在其中则直接过滤,从而减轻数据库层面的压力。
3.空值缓存:一种比较简单的解决办法,在第一次查询完不存在的数据后,将该key与对应的空值也放入缓存中,只不过设定为较短的失效时间,例如几分钟,这样则可以应对短时间的大量的该key攻击,设置为较短的失效时间是因为该值可能业务无关,存在意义不大,且该次的查询也未必是攻击者发起,无过久存储的必要,故可以早点失效。
缓存雪崩
因为缓存服务挂掉或者热点缓存失效,所有请求都去查数据库,导致数据库连接不够或者数据库处理不过来,从而导致整个系统不可用。
解决方案:
加锁排队、 设置过期标志更新缓存 、 设置过期标志更新缓存 、二级缓存(引入一致性问题)、 预热、 缓存与服务降级。
1.线程互斥:只让一个线程构建缓存,其他线程等待构建缓存的线程执行完,重新从缓存获取数据才可以,每个时刻只有一个线程在执行请求,减轻了db的压力,但缺点也很明显,降低了系统的qps。
2.交错失效时间:这种方法时间比较简单粗暴,既然在同一时间失效会造成请求过多雪崩,那我们错开不同的失效时间即可从一定长度上避免这种问题,在缓存进行失效时间设置的时候,从某个适当的值域中随机一个时间作为失效时间即可。
缓存击穿
缓存击穿实际上是缓存雪崩的一个特例,缓存击穿是指缓存中没有但数据库中有的数据(一般是缓存时间到期),这时由于并发用户特别多,同时读缓存没读到数据,又同时去数据库去取数据,引起数据库压力瞬间增大,造成过大压力。击穿与雪崩的区别即在于击穿是对于某一特定的热点数据来说,而雪崩是全部数据。
解决方案:
1.缓存设置不过期。
从redis上看,确实没有设置过期时间,这就保证了,不会出现热点key过期问题,也就是物理不过期。但是它会遇到一个数据更新的问题,或者说数据不一致的问题。
在value中存储过期时间,在编码处理的时候,有条件(过期时间小于一分钟)对缓存数据进行更新,这个方案对性能最佳。
2.使用锁工具(分布式锁)
$redis->setnx($key,time()+$expire);
# 加锁
$redis->del($key);
# 解锁
#新版本加锁
#NX意思为SET IF NOT EXIST,即当key不存在时,我们进行set操作;
#若key已经存在,则不做任何操作;
#PX意思是给这个key加一个过期设置
$redis->set($resource, $token, ['NX', 'PX' => 10 ]);
总结:缓存好比防弹衣,不意味着你穿上防弹衣就可以刀枪不入,只有更好的使用缓存才会达到更好的作用,方案有很多,适合你的就是好的。