在进行大批量更新或删除时,将数据分批次分别进行更新和删除。例如:更新用户所有已过期的优惠券为不可用状态。
SQL 语句:
update status=0 FROM `coupon` WHERE expire_date <= #{currentDate} and status=1;
如果大量优惠券需要更新为不可用状态,执行这条 SQL 可能会堵死其他 SQL,分批处理伪代码如下:
int pageNo = 1; int PAGE_SIZE = 100; while(true) { List<Integer> batchIdList = queryList('select id FROM `coupon` WHERE expire_date <= #{currentDate} and status = 1 limit #{(pageNo-1) * PAGE_SIZE},#{PAGE_SIZE}'); if (CollectionUtils.isEmpty(batchIdList)) { return; } update('update status = 0 FROM `coupon` where status = 1 and id in #{batchIdList}') pageNo ++; }
通常 <> 操作符无法使用索引,举例如下,查询金额不为 100 元的订单:
select id from orders where amount != 100;
如果金额为 100 的订单极少,这种数据分布严重不均的情况下,有可能使用索引。
鉴于这种不确定性,采用 union 聚合搜索结果,改写方法如下:
(select id from orders where amount > 100) union all (select id from orders where amount < 100 and amount > 0)
在 Innodb 引擎下 OR 无法使用组合索引,比如:
select id,product_name from orders where mobile_no = '13421800407' or user_id = 100;
OR 无法命中 mobile_no + user_id 的组合索引,可采用 union,如下所示:
(select id,product_name from orders where mobile_no = '13421800407') union (select id,product_name from orders where user_id = 100);
此时 id 和 product_name 字段都有索引,查询才最高效。
IN 适合主表大子表小,EXIST 适合主表小子表大。由于查询优化器的不断升级,很多场景这两者性能差不多一样了。
尝试改为 Join 查询,举例如下:
select id from orders where user_id in (select id from user where level = 'VIP');
采用 Join 如下所示:
select o.id from orders o left join user u on o.user_id = u.id where u.level = 'VIP';
通常在查询条件列运算会导致索引失效,如下所示,查询当日订单:
select id from order where date_format(create_time,'%Y-%m-%d') = '2019-07-01';
date_format 函数会导致这个查询无法使用索引,改写后:
select id from order where create_time between '2019-07-01 00:00:00' and '2019-07-01 23:59:59';
如果不查询表中所有的列,避免使用 SELECT *,它会进行全表扫描,不能有效利用索引。
Like 用于模糊查询,举个例子(field 已建立索引):
SELECT column FROM table WHERE field like '%keyword%';
这个查询未命中索引,换成下面的写法:
SELECT column FROM table WHERE field like 'keyword%';
去除了前面的 % 查询将会命中索引,但是产品经理一定要前后模糊匹配呢?全文索引 fulltext 可以尝试一下,但 Elasticsearch 才是终极武器。
Join 的实现是采用 Nested Loop Join 算法,就是通过驱动表的结果集作为基础数据,通过该结数据作为过滤条件到下一个表中循环查询数据,然后合并结果。
如果有多个 Join,则将前面的结果集作为循环数据,再次到后一个表中查询数据。
驱动表和被驱动表尽可能增加查询条件,满足 ON 的条件而少用 Where,用小结果集驱动大结果集。
被驱动表的 Join 字段上加上索引,无法建立索引的时候,设置足够的 Join Buffer Size。
禁止 Join 连接三个以上的表,尝试增加冗余字段。
Limit 用于分页查询时越往后翻性能越差,解决的原则:缩小扫描范围,如下所示:
select * from orders order by id desc limit 100000,10 耗时0.4秒 select * from orders order by id desc limit 1000000,10 耗时5.2秒
先筛选出 ID 缩小查询范围,写法如下:
select * from orders where id > (select id from orders order by id desc limit 1000000, 1) order by id desc limit 0,10 耗时0.5秒
如果查询条件仅有主键 ID,写法如下:
select id from orders where id between 1000000 and 1000010 order by id desc 耗时0.3秒
如果以上方案依然很慢呢?只好用游标了,感兴趣的朋友阅读 JDBC 使用游标实现分页查询的方法。