Mysql 随机查询、更新、删除

最近做一个库存发货的业务，用户购买一个商品时（例如游戏点卡），需要随机的从库存表中选择一个返回给用户。

查了下资料，mysql大致有三种方式来实现随机查询，总结在这里

创建测试数据

创建一个库存表，包括产品id、劵码code

#创建表
DROP TABLE IF EXISTS `product_stock`
CREATE TABLE `product_stock` (
  `id` int(10) NOT NULL AUTO_INCREMENT,
  `product_code` varchar(64) DEFAULT NULL,
  `voucher_code` varchar(64) DEFAULT NULL,
  PRIMARY KEY (`id`),
   KEY `product_code` (`product_code`) USING BTREE
 ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

利用存储过程，依次创建1w条 kfc劵码库存、10w条McDonald劵码库存、100w条Dicos劵码库存

## 依次创建1w、10w、100w的测试数据
DROP PROCEDURE IF EXISTS batch_insert;
delimiter $$
 create procedure batch_insert()
 begin
    DECLARE max int;
DECLARE rc int;
    set max =10000;
    set rc =0;
loopl: while rc<max do
        INSERT INTO `test`.`product_stock`(`product_code`, `voucher_code`) VALUES ('Dicos',concat('hasdq23aad',rc));
        set rc=rc+1;
end while loopl;
 end$$
 delimiter ;

 call batch_insert();

查询数目

mysql> select product_code, count(*) from product_stock  GROUP BY product_code;
+--------------+----------+
| product_code | count(*) |
+--------------+----------+
| Dicos        |  1000000 |
| kfc          |    10000 |
| McDonald     |   100000 |
+--------------+----------+
3 rows in set (0.29 sec)

1. 最简单的方式：rand()

最简单的随机查询，就是利用mysql的rand()函数

## 1w row
mysql> SELECT * FROM product_stock where product_code = 'kfc' ORDER BY RAND() LIMIT 5;
5 rows in set (0.02 sec)
## 10w row
mysql> SELECT * FROM product_stock where product_code = 'McDonald' ORDER BY RAND() LIMIT 5;
5 rows in set (0.19 sec)
## 100w row
mysql> SELECT * FROM product_stock where product_code = 'Dicos' ORDER BY RAND() LIMIT 5;
5 rows in set (1.87 sec)

我们再分析下使用rand()时mysql做了什么

mysql> EXPLAIN SELECT * FROM product_stock where product_code = 'kfc' ORDER BY RAND() LIMIT 5;
+----+-------------+---------------+------+---------------+--------------+---------+-------+-------+--------------------------------------------------------+
| id | select_type | table         | type | possible_keys | key          | key_len | ref   | rows  | Extra                                                  |
+----+-------------+---------------+------+---------------+--------------+---------+-------+-------+--------------------------------------------------------+
|  1 | SIMPLE      | product_stock | ref  | product_code  | product_code | 259     | const | 17758 | Using index condition; Using temporary; Using filesort |
+----+-------------+---------------+------+---------------+--------------+---------+-------+-------+--------------------------------------------------------+

分析下Extra：Using index condition; Using temporary; Using filesort
Using index condition：这条sql语句先通过product_code索引查询出所有kfc的行数
Using temporary：对于每条记录，调用 rand() 函数生成一个随机小数，将随机小数和每行列信息（列信息太多时只会放索引）存进中间表
Using filesort：对中间表数据，根据随机小数进行排序。排序结束后取前5行返回（filesort排序原理请看：xxxx）
再分析下rows：17758
kfc有1w条数据，所以17758中有10000是根据product_code索引查询出来的；
根据随机数排序完成后，需要查询前5条数据返回，所以剩下的7758中有5条记录是返回数据查询用的；
剩下的7753条数据，猜测就是排序时用到的。mysql中排序会用到快排，优先队列排序，数据量太大sort_buffer填不完时，还会进行归并排序

2. 最高效的方式：随机id

这个方法具体实现原理就是，在满足条件的行id中随机选择5条记录，然后再根据随机id查询出记录：

## 查出Dicos记录的最小id和最大id
select max(id),min(id) into @Max,@Min from product_stock where product_code = 'Dicos';
## 在[min,max]之间随机出5个id
set @X1= floor((@Max-@Min+1)*rand() + @Min);
set @X2= floor((@Max-@Min+1)*rand() + @Min);
set @X3= floor((@Max-@Min+1)*rand() + @Min);
set @X4= floor((@Max-@Min+1)*rand() + @Min);
set @X5= floor((@Max-@Min+1)*rand() + @Min);
## 根据随机id，查询出5条数据
select * from product_stock where id >= @X1 limit 1 UNION All
(select * from product_stock where id >= @X2 limit 1) UNION All
(select * from product_stock where id >= @X3 limit 1) UNION All
(select * from product_stock where id >= @X4 limit 1) UNION All
(select * from product_stock where id >= @X5 limit 1)

这种方法查询100w数据的“Dicos”，也只会使用0.08s

但是最大的弊端在于，这种方法要求数据的id连续不中断的；如果数据是随机分布，那用该办法可能会命中其余的数据；如果数据id连续但不均匀（如1，2，500，600……），则随机概率不准确

3. 最通用的方式：随机row

这种方式完善了上一种方式的缺陷，实现原理是，在满足条件的行中随机选择5行记录，然后使用limit查询返回：

## 查出Dicos记录的总数目
select count(*) into @C from product_stock where product_code = 'Dicos';
## 随机出5行
set @Y1 = floor(@C * rand());
set @Y2 = floor(@C * rand());
set @Y3 = floor(@C * rand());
set @Y4 = floor(@C * rand());
set @Y5 = floor(@C * rand());
## **注意，以下为伪代码**
## 获取行数最小和最大值
set @Min = MIN(@Y1,@Y2,@Y3,@Y4,@Y5)
set @Max = MAX(@Y1,@Y2,@Y3,@Y4,@Y5)
## 查询出最大行、最小行之间的id数据
select id from product_stock where product_code = 'Dicos' limit @Min, @Max-@Min+1
## 获取第0，@Y2-@Y1, @Y3-@Y1, @Y4-@Y1, @Y5-@Y1个数据的id，再根据id查询出指定数据即可

这种方式最耗时的是count(*)和limit语句，我们实践极端情况(最小，最大值横跨所有记录)的耗时为0.807s

select count(*) into @C from product_stock where product_code = 'Dicos';
select id from product_stock where product_code = 'Dicos' limit 0, 1000000;

我们再分析下 limit语句的执行

mysql> EXPLAIN select id from product_stock where product_code = 'Dicos' limit 0, 1000000;
+----+-------------+---------------+------+---------------+--------------+---------+-------+--------+--------------------------+
| id | select_type | table         | type | possible_keys | key          | key_len | ref   | rows   | Extra                    |
+----+-------------+---------------+------+---------------+--------------+---------+-------+--------+--------------------------+
|  1 | SIMPLE      | product_stock | ref  | product_code  | product_code | 259     | const | 544082 | Using where; Using index |
+----+-------------+---------------+------+---------------+--------------+---------+-------+--------+--------------------------+
1 row in set (0.00 sec)

可以看出，虽然扫描了所有的Dicos，但是与rand()方式相比，没有用到中间表，也没有用到file sort，所以速度上还是快很多

随机更新、删除

随机更新、删除的实现和随机查询差不多，这里提供rand()版：

## 随机更新
update product_stock set voucher_code = "aa" where product_code = 'Dicos' order by rand() limit 5;
## 随机删除
delete from product_stock where product_code = 'Dicos' order by rand() limit 5;

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,271评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,275评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,151评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,550评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,553评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,559评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,924评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,580评论 0赞 257
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,826评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,578评论 2赞 320
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,661评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,363评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,940评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,926评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,156评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,872评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,391评论 2赞 342