MySQL性能优化 —— SQL 优化

MySQL性能优化 —— SQL 优化

分批处理

在进行大批量更新或删除时,将数据分批次分别进行更新和删除。例如:更新用户所有已过期的优惠券为不可用状态。

SQL 语句:

update status=0 FROM `coupon` WHERE expire_date <= #{currentDate} and status=1;

如果大量优惠券需要更新为不可用状态,执行这条 SQL 可能会堵死其他 SQL,分批处理伪代码如下:

int pageNo = 1; 
int PAGE_SIZE = 100; 
while(true) { 
    List<Integer> batchIdList = queryList('select id FROM `coupon` WHERE expire_date <= #{currentDate} and status = 1 limit #{(pageNo-1) * PAGE_SIZE},#{PAGE_SIZE}'); 
    if (CollectionUtils.isEmpty(batchIdList)) { 
        return; 
    } 
    update('update status = 0 FROM `coupon` where status = 1 and id in #{batchIdList}') 
    pageNo ++; 
}

操作符 <> 优化

通常 <> 操作符无法使用索引,举例如下,查询金额不为 100 元的订单:

select id from orders where amount  != 100;

如果金额为 100 的订单极少,这种数据分布严重不均的情况下,有可能使用索引。

鉴于这种不确定性,采用 union 聚合搜索结果,改写方法如下:

(select id from orders where amount > 100) 
 union all 
(select id from orders where amount < 100 and amount > 0)

OR 优化

在 Innodb 引擎下 OR 无法使用组合索引,比如:

select id,product_name from orders where mobile_no = '13421800407' or user_id = 100;

OR 无法命中 mobile_no + user_id 的组合索引,可采用 union,如下所示:

(select id,product_name from orders where mobile_no = '13421800407') 
 union 
(select id,product_name from orders where user_id = 100);

此时 id 和 product_name 字段都有索引,查询才最高效。

IN 优化

IN 适合主表大子表小,EXIST 适合主表小子表大。由于查询优化器的不断升级,很多场景这两者性能差不多一样了。

尝试改为 Join 查询,举例如下:

select id from orders where user_id in (select id from user where level = 'VIP');

采用 Join 如下所示:

select o.id from orders o left join user u on o.user_id = u.id where u.level = 'VIP';

不做列运算

通常在查询条件列运算会导致索引失效,如下所示,查询当日订单:

select id from order where date_format(create_time,'%Y-%m-%d') = '2019-07-01';

date_format 函数会导致这个查询无法使用索引,改写后:

select id from order where create_time between '2019-07-01 00:00:00' and '2019-07-01 23:59:59';

避免Select All

如果不查询表中所有的列,避免使用 SELECT *,它会进行全表扫描,不能有效利用索引。

Like 优化

Like 用于模糊查询,举个例子(field 已建立索引):

SELECT column FROM table WHERE field like '%keyword%';

这个查询未命中索引,换成下面的写法:

SELECT column FROM table WHERE field like 'keyword%';

去除了前面的 % 查询将会命中索引,但是产品经理一定要前后模糊匹配呢?全文索引 fulltext 可以尝试一下,但 Elasticsearch 才是终极武器。

Join 优化

Join 的实现是采用 Nested Loop Join 算法,就是通过驱动表的结果集作为基础数据,通过该结数据作为过滤条件到下一个表中循环查询数据,然后合并结果。

如果有多个 Join,则将前面的结果集作为循环数据,再次到后一个表中查询数据。

驱动表和被驱动表尽可能增加查询条件,满足 ON 的条件而少用 Where,用小结果集驱动大结果集。

被驱动表的 Join 字段上加上索引,无法建立索引的时候,设置足够的 Join Buffer Size。

禁止 Join 连接三个以上的表,尝试增加冗余字段。

Limit 优化

Limit 用于分页查询时越往后翻性能越差,解决的原则:缩小扫描范围,如下所示:

select * from orders order by id desc limit 100000,10  
耗时0.4秒 
select * from orders order by id desc limit 1000000,10 
耗时5.2秒

先筛选出 ID 缩小查询范围,写法如下:

select * from orders where id > (select id from orders order by id desc  limit 1000000, 1) order by id desc limit 0,10 
耗时0.5秒

如果查询条件仅有主键 ID,写法如下:

select id from orders where id between 1000000 and 1000010 order by id desc 
耗时0.3秒

如果以上方案依然很慢呢?只好用游标了,感兴趣的朋友阅读 JDBC 使用游标实现分页查询的方法。

参考:https://www.toutiao.com/i6829475322774159880/?timestamp=1590117538&app=news_article&group_id=6829475322774159880&req_id=202005221118580100210341010C01470C 

我们愈是学习,愈觉得自己的贫乏。 —— 雪莱
0 不喜欢
说说我的看法 -
全部评论(
没有评论
关于
本网站专注于 Java、数据库(MySQL、Oracle)、Linux、软件架构及大数据等多领域技术知识分享。涵盖丰富的原创与精选技术文章,助力技术传播与交流。无论是技术新手渴望入门,还是资深开发者寻求进阶,这里都能为您提供深度见解与实用经验,让复杂编码变得轻松易懂,携手共赴技术提升新高度。如有侵权,请来信告知:hxstrive@outlook.com
其他应用
公众号