博客
关于我
MySQL 8 Anti-Join 几点总结
阅读量:102 次
发布时间:2019-02-26

本文共 1101 字,大约阅读时间需要 3 分钟。

MySQL NOT EXISTS与NOT IN子句的优化与反join新特性

作者:郑松华,知数堂SQL优化班老师,网名:骑龟的兔子

导读

作者郑松华在关注您就感到紧张吗?别担心,今天我就来和大家分享一个MySQL 8.0.18版本中引入的全新特性——反join(Anti Join)。这对数据库性能优化来说是个重大的突破,特别是在处理NOT EXISTS和NOT IN子句时。


MySQL 8.0.18版本中的反join

在5.7版本中,NOT EXISTS和NOT IN子句的执行计划主要依赖DEPENDENT SUBQUERY,这类似于函数调用,需要外层查询为每个结果集进行处理,效率较低。而在8.0.18版本中,这两种子句被优化为反join,这带来了更高效的执行方式。


反join的优势

反join(Anti Join)与传统的DEPENDENT SUBQUERY不同,它不仅支持嵌套循环join,还可以通过哈希join(Hash Join)实现更高效的查询处理。这种机制使得反join在处理大规模数据时效率显著提升。


5.7版本与8.0.18版本的对比

在5.7版本中,执行计划为DEPENDENT SUBQUERY,类似于函数调用,效率较低。而在8.0.18版本中,执行计划变为反join,具体表现为:

  • 5.7版本:执行计划为DEPENDENT SUBQUERY,效率较低。
  • 8.0.18版本:执行计划为反join,可以选择哈希join或嵌套循环join,效率提升。

哈希join的应用场景

哈希join在数据分布较均匀时表现尤为出色。与传统的嵌套循环join相比,哈希join的加速效果更为显著,尤其是在处理大规模数据时,能够更快地找到匹配的记录。


执行计划解读

通过EXPLAIN分析,我们可以更清晰地了解反join的执行方式:

  • 5.7版本:执行计划为DEPENDENT SUBQUERY,效率较低。
  • 8.0.18版本:执行计划为反join,具体为嵌套循环join或哈希join,效率显著提升。

反join的潜在问题

在使用反join时,需要注意以下几点:

  • 索引优化:确保外层表和内层表的索引结构合理,避免过多索引导致执行时间过长。
  • 数据分布:反join的效率依赖于数据分布,建议在数据分布较均匀的场景下使用哈希join。

  • 结论

    反join的引入为MySQL 8.0.18版本带来了全新的查询优化方式,特别是在处理NOT EXISTS和NOT IN子句时。通过反join,我们可以更高效地处理大规模数据,减少执行时间。


    欢迎加入高性能MySQL技术专家群,和我一起探讨更多数据库优化技巧!

    转载地址:http://vnkz.baihongyu.com/

    你可能感兴趣的文章
    Nginx配置ssl实现https
    查看>>
    Nginx配置TCP代理指南
    查看>>
    Nginx配置——不记录指定文件类型日志
    查看>>
    Nginx配置代理解决本地html进行ajax请求接口跨域问题
    查看>>
    Nginx配置参数中文说明
    查看>>
    Nginx配置好ssl,但$_SERVER[‘HTTPS‘]取不到值
    查看>>
    Nginx配置如何一键生成
    查看>>
    Nginx配置实例-负载均衡实例:平均访问多台服务器
    查看>>
    NHibernate学习[1]
    查看>>
    NIFI1.21.0_Mysql到Mysql增量CDC同步中_日期类型_以及null数据同步处理补充---大数据之Nifi工作笔记0057
    查看>>
    NIFI1.21.0_NIFI和hadoop蹦了_200G集群磁盘又满了_Jps看不到进程了_Unable to write in /tmp. Aborting----大数据之Nifi工作笔记0052
    查看>>
    NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_增删改数据分发及删除数据实时同步_通过分页解决变更记录过大问题_02----大数据之Nifi工作笔记0054
    查看>>
    NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置binlog_使用处理器抓取binlog数据_实际操作01---大数据之Nifi工作笔记0040
    查看>>
    NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置数据路由_实现数据插入数据到目标数据库_实际操作03---大数据之Nifi工作笔记0042
    查看>>
    NIFI同步MySql数据_到SqlServer_错误_驱动程序无法通过使用安全套接字层(SSL)加密与SQL Server_Navicat连接SqlServer---大数据之Nifi工作笔记0047
    查看>>
    Nifi同步过程中报错create_time字段找不到_实际目标表和源表中没有这个字段---大数据之Nifi工作笔记0066
    查看>>
    NIFI大数据进阶_离线同步MySql数据到HDFS_02_实际操作_splitjson处理器_puthdfs处理器_querydatabasetable处理器---大数据之Nifi工作笔记0030
    查看>>
    NIFI大数据进阶_连接与关系_设置数据流负载均衡_设置背压_设置展现弯曲_介绍以及实际操作---大数据之Nifi工作笔记0027
    查看>>
    NIFI数据库同步_多表_特定表同时同步_实际操作_MySqlToMysql_可推广到其他数据库_Postgresql_Hbase_SqlServer等----大数据之Nifi工作笔记0053
    查看>>
    NIFI汉化_替换logo_二次开发_Idea编译NIFI最新源码_详细过程记录_全解析_Maven编译NIFI避坑指南001---大数据之Nifi工作笔记0068
    查看>>