大家好,这是皮爷给大家带来的最新的学习Python能干啥?之Django教程的进阶版。
在之前《用Django全栈开发》系列专辑里面,皮爷详细的阐述了如何编写一个完整的网站,具体效果可以浏览线上网站:Peekpa.com
从进阶篇开始,每一篇文章都是干货满满,干的不行。这一节,我们来说:如果网页被大量快速访问,该如何限制。
Peekpa.com的官方地址:http://peekpa.com
获取整套教程源码唯一途径,关注『皮爷撸码』,回复『peekpa.com』
皮爷的每一篇文章,都配置相对应的代码。这篇文章的代码对应的Tag是“Advanced_07”。
场景分析
每一次用户的访问,对服务器来说,都是一个request。对每一个request,服务器都会耗费CPU来处理请求。如果同一个IP,访问速度过快,比如一秒钟发来十几个请求甚至百个,那么你的服务器即使再有缓存,对待每一个请求,多多少少你也得走几行代码。如果访问的主机短时间之内暴增,而且每台机器都短时间内大量发送请求,那么你的服务器短时间之内就会崩掉。
所以,针对上面的场景,我们需要对我们的网站添加一个限制刷新评率的功能。就像某知名论坛一样,刷新频率不得超过2秒:
Django-ratelimit
如何实现请求次数的限制?
我们这里准备使用Django-ratelimit
来实现。当然,首先还是来安装:
$ pip install django-ratelimit==3.0.0
安装好之后,我们接下来看如何使用。
在Django-ratelimit库中,你可以使用注解的方式来实现刷新限制,或者直接调用方法:
- 直接方法有:
@ratelimit()
; - 直接调用方法有:
get_usage()
以及is_ratelimited()
; - 最后抛出一个:
ratelimit.exceptions.Ratelimited
如何实现控制
注解视图函数
通过注解实现,这个使用起来很简单,只需要直接在你需要限制的视图函数里面添加注解就可以了,比如,我们这里将首页添加限制:
@ratelimit(key='ip', rate='2/10s', block=True)
@peekpa_tracking
def index(request):
xxxxxx
这里我们采取的是:1.限制元素是ip;2.限制频率是每10秒最多访问两次;3.是否block访问,这里是True。
我们来刷新的试一下:
可以看到,这里如果快速刷新,网站会抛出一个403异常,这其实说明我们的拦截已经成功了。
注解视图类
对于类的修饰器,我们只需要使用@method_decorator()
修饰器就可以,然后把ratelimit放进去就可以,我们以数据中心里面的日本地震信息为例:
@method_decorator(ratelimit(key='ip', rate='2/10m', block=True), name='get')
@method_decorator(peekpa_code_required, name='get')
@method_decorator(peekpa_tracking, name='get')
class JpEarthView(View):
def get(self, request):
xxxx
这个时候我们也刷新一下数据中心的地震信息:
也可以看到,刷新过快的话,我们的页面就会抛出异常。
主要方法使用
通过注解的方式其实能够满足很多使用场景。但是如果每一个视图函数我们都写一遍的话,会很糟糕。所以,有些时候,我们还是需要使用ratelimit的核心方法来玩。
比如,我们在好多页面,为了汇总用户访问,我们都会加一个peekpa_tracking
注释。所以,为了方便统一,我们可以在这个注释里面,使用核心方法来控制限制访问频率。
这里的核心方法主要有两个:
-
get_usage(request, group=None, fn=None, key=None, rate=None, method=ALL, increment=False)
返回类型是一个字典,里面包含了ratelimit的所有基本信息,是否屏蔽,还剩多长时间,都在这个里面显示; -
is_ratelimited(request, group=None, fn=None, key=None, rate=None, method=ALL, increment=False)
返回一个布尔类型,是否屏蔽。
我们修改之后的peekpa_tracking
方法:
def peekpa_tracking(func):
def wrapper(request, *args, **kwargs):
block_info = get_usage(request, key="ip", fn=func, rate="2/10s", increment=True)
print(block_info)
tacking_info(request)
return func(request, *args, **kwargs)
return wrapper
我们这里看到:
- 屏蔽关键字是ip地址;
- 屏蔽的函数是传入的func;
- 屏蔽的评率是每10秒最多访问2次;
- 如果超过2次,则选择屏蔽increment=True。
这个时候,我们再来看一下访问首页之后,控制台终端打印出来的信息是什么:
可以看到这里,get_usage()
给我们返回的字典类型,总共有这么几个变量:
- count:一次屏蔽周期之内访问次数;
- limit:屏蔽周期之内最大访问次数;
- should_limit:是否要屏蔽;
- time_left:屏蔽周期剩余时间。
看到截图中,我们设定的是10秒最多2次,当超过2次的时候,should_limit
变成了True,其实就是出发了屏蔽。当然,是否需要屏蔽,必须设置 increment=True
才能开启,这个值默认是False的。
接下来,我们再看一下is_ratelimited()
的代码,这个在ratelimit.core
路径中,方法只返回一个布尔值,来判断是否需要屏蔽:
def is_ratelimited(request, group=None, fn=None, key=None, rate=None,
method=ALL, increment=False):
usage = get_usage(request, group, fn, key, rate, method, increment)
if usage is None:
return False
return usage['should_limit']
这里可以清楚的看到,其实is_ratelimited()
就是对get_usage()
的一层封装而已,放回的结果其实也就是get_usage()
返回结果中的should_limit
变量。
如果被屏蔽了,ratelimit库会抛出一个Ratelimited()
异常,这个异常会被系统捕捉,返回403code。所以,想要自定义403页面的话,可以参考之前系统自定义404页面的做法,一模一样。
这样,我们就可以通过ratelimit轻松实现刷新评率的限制。
技术总结
最后总结一下,
Django如何实现刷新评率限制:
- 通过使用
django-ratelimit
库来实现; - 可以通过
@ratelimit()
注解的形式,对方法或者视图函数修饰,进行限制。; - 也可以自己根据需求,调用库的核心方法
get_usage()
,通过返回的数据做出处理; - 进阶篇的在Django中限制刷新频率总结完毕。
获取整套教程源码唯一途径,关注『皮爷撸码』,回复『peekpa.com』
长按下图二维码关注,如文章对你有启发或者能够帮助到你,欢迎点赞,在看,转发三连走一发,这是对我原创内容输出的最大肯定。