MySQL count性能优化

2018-09-19 7.5k MySQL 发表评论

select count(*)是MySQL中用于统计记录行数最常用的方法。

count方法可以返回表内精确的行数，每执行一次都会进行一次全表扫描，

以避免由于其他连接进行delete和insert引起结果不精确。

在某些索引下是好事，但是如果表中有主键，count(*)的速度就会很慢，特别在千万记录以上的大表。

如果用 explain 命令速度会快很多，因为 explain 用并不真正执行查询，而是查询优化器【估算】的行数。

在一个1500万条记录的表中测试，用select count(*)耗时15s，而用explain耗时0.08秒，

两者相差差不多有200倍之多（第一次执行会稍慢，3秒左右）。

如下是explain方式：

mysql> explain select * from posts;
+----+-------------+-------------+------------+------+---------------+------+---------+------+----------+----------+-------+
| id | select_type | table       | partitions | type | possible_keys | key  | key_len | ref  | rows     | filtered | Extra |
+----+-------------+-------------+------------+------+---------------+------+---------+------+----------+----------+-------+
|  1 | SIMPLE      | posts       | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 12596096 |   100.00 | NULL  |
+----+-------------+-------------+------------+------+---------------+------+---------+------+----------+----------+-------+

1 row in set, 1 warning (0.08 sec)

注意，这里用的是select *，不是~~select count(*)~~。

select *会返回一行数据，包括估算行数rows，在PHP中我们fetch()，再通过$result['rows']就可以拿到这个预估值。

select count(*)则会在extra中有一行Select tables optimized away，不会拿到函数估算值。

所以，在对数据准确性要求不高，但是对速度要求很苛刻的场合，绝对有必要用这个估算值代替。

你也可以用下面这句，结果和explain一模一样：

select TABLE_ROWS FROM INFORMATION_SCHEMA.TABLES where TABLE_NAME='posts';
+------------+
| TABLE_ROWS |
+------------+
|   12596096 |
+------------+
1 row in set (0.04 sec)

根据实际情况任选一个，都是同一个东西。

参考资料：

Why is count(*) slow, when explain knows the answer?

上一篇： Docker中PHP-FPM容器无法记录日志

下一篇：命令行创建和运行VirtualBox虚拟机

发表回复 取消回复

发表回复取消回复