AOF重写导致的Redis进程被kill

Redis环境描述

服务器：阿里云16GB服务器
Redis版本： 5.0.5
持久化方式： AOF

问题描述

阿里云环境，使用docker安装的单节点redis5.x，频繁出现redis进程被操作系统kill，直到redis容器直接启动失败，查找/var/log/messages文件，可以看到以下内容：

1.png

谷歌了一下total-vm和anon-rss，没看太明白什么意思，服务器物理内存是16GB，姑且认为total-vm是物理内存，anon-rss就是redis进程占用的内存量了，这么看应该是redis占用内存过高导致的进程被杀；

问题查找

查看redis持久化文件appendonly.aof存储目录，如下所示：

2.png

从上图可以看到当前目录存在很多temp-rewriteaof-xxx.aof，这是aof文件重写时产生的临时文件，xxx表示重写时fork的子进程的进程号，这里存在这么多的临时文件表示redis已经进行了很多次重写，但是因为内存不足导致子进程被kill掉。查看阿里云的监控信息，发现确实存在内存飙升的情况：

3.png

正常来说子进程被kill掉，不应该影响redis容器，但是现在的情况是redis容器直接不可用了，需要重启docker服务才可以，这个应该跟docker的进程管理有关，不做深究，现在基本可以定位导致问题的原因是redis发生aof重写时由于内存不足导致子进程被kill掉，从而导致redis服务不可用。

aof重写原理

这个要从AOF文件重写的过程来说，AOF是Redis的一种持久化方式，在客户端执行写入命令时，Redis会将命令缓存在AOF缓冲区中，再根据同步策略（三种：always、everysec、no）将命令同步到appendonly.aof文件中，随着aof文件越来越大，达到配置文件中auto-aof-rewrite-min-size和auto-aof-rewrite-percentage参数配置的阈值时，redis将触发aof重写，此时会fork一个子进程进行aof重写，在aof重写过程中客户端新的写入命令会暂存于aof重写缓冲区中，直到子进程重写完成后，将aof重写缓冲区中的内容再追加到新的aof文件中，最后使用新的aof文件替换旧的aof文件。

基于以上aof重写原理可以知道，如果在子进程重写过程中，系统的写入量很大，那么aof重写缓冲区占用的内存就会越来越大，从而导致内存占用量持续上升。

问题处理

修改redis配置文件中auto-aof-rewrite-percentage参数值为800，表示当当前的aof文件大小是上次重写后aof文件大小的8倍时才触发重写。

然后将redis重启，经过漫长的数据加载之后，通过redis客户端工具可以看到，redis中数据已经超过13GB，服务器的屋里内存是16GB，按理说fork子进程进行重写时使用的是copy_on_write，每10GB内存只需要20MB左右的内存页表，还剩下3GB的内存可用，即使aof复制缓冲区zai在持续增大也不至于直接将redis给kill掉，这个牵扯到操作系统另外一个参数的配置，如下所示：

4.png

这个牵扯到linux内存分配的问题，不做深究，根据提示就是需要将vm.overcommit_memory这个参数由0改为1，表示内核允许超量使用内存直到用完为止，设置命令如下：

$ echo "vm.overcommit_memory=1" >> /etc/sysctl.conf
$ sysctl vm.overcommit_memory=1

redis启动时另外一个警告，如下：

5.png

这个是redis内核默认开启了THP特性，支持大内存页分配，当开启时可以降低fork子进程的速度，但fork操作之后，每个内存页由4k变成了2M，这个会大幅度增加重写期间主进程内存的消耗，同时每次写命令引起的复制内存页单位放大了512倍，会拖慢写操作的执行时间，导致大量的写操作慢查询，因此redis建议关闭该特性。

禁用命令：

$ echo never >  /sys/kernel/mm/transparent_hugepage/enabled

以上两个参数修改完成以后还需要修改redis的最大内存，建议单个redis最大内存在10GB以内，但是目前redis的内存占用已经达到了13GB，因此将该redis迁移到另外一台内存为32GB的服务器上，因为还要进行其他操作暂未设置最大内存，如果考虑集群的话最好单个redis内存不超过10GB，不搭建集群的话需要设置redis的最大内存，建议保留20%-30%的空闲物理内存。

本次问题先使用临时的解决方案进行处理，后续优化缓存内容以及扩展机器以后再进行整体的优化配置。

参考内容

1.Redis开发与运维

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,607评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,047评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,496评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,405评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,400评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,479评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,883评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,535评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,743评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,544评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,612评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,309评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,881评论 3赞 306
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,891评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,136评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,783评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,316评论 2赞 342