对查询性能影响的因素有很多,下面说说其中的一方面,<b>查询是否向数据库请求了不需要的数据</b>。
有些查询请求超过实际需要的数据,这些多余的数据会被应用丢弃,同时给数据库带来额外的开销,比如消耗cpu和内存资源等。
1、查询不需要的记录
常常有人误以为mysql
只会返回需要的数据,实际上mysql
是先返回全部结果集再进行计算。
一个简单的情景,先用select语句查询大量结果,然后只获取前面N条就关闭结果集。这样mysql会查出全部的结果集,客户端程序接受全部结果集,然后抛弃其中大部分数据。最简单有效的解决方法是在查询后面加上limit。
2、多表关联时返回全部列
在关联查询时,总是返回全部列,而有些表的列并不是我们需要的数据。
例如下面的一个查询电影Academy Dinosaur
中出现的演员,千万不要用下面的写法。
mysql>
select * from actor
->inner join film_actor using(actor_id)
->inner join film using(film_id)
->where film.title = 'Academy Dinosaur';
这将返回三个表的全部数据列。正确的方式是只取需要的列:
select actor.* from actor...;
3、总是取出全部列
每当我们看到select *
的时候,都要用怀疑的眼光审视。取出全部列,会让优化器无法完成索引覆盖扫描这类优化,同时为服务器带来额外的I/O、内存和cpu的消耗。所以大多数情况只取需要的列。
当然特殊的情况也是有的,查询返回超过需要的数据也不总是坏事。比如有些能提高代码片段复用性的语句,这样能够简化开发,虽然浪费了点数据库资源。同时在涉及到缓存时,获取并缓存所有的列,相比多个独立获取部分列的查询可能更好。这些都是由具体的应用场景所决定的。
4、重复查询相同的数据
一不小心,我么就会有这样的错误——重复执行相同的查询,每次都返回相同的数据。
例如,在用户评论的地方需要查询用户头像的url,当用户多次评论时,就会反复查询这个数据。解决方法是初次查询时将这个数据缓存起来,需要的时候从缓存中取。