【Java 开发日记】我们来说一说什么是联合索引最左匹配原则?

【Java 开发日记】我们来说一说什么是联合索引最左匹配原则?

目录

什么是联合索引?

什么是最左匹配原则?

核心要点:

举例说明

✅ 场景一:完全匹配最左列

✅ 场景二:匹配所有列

✅ 场景三:匹配最左连续列

❌ 场景四:跳过最左列

⚠️ 场景五:包含最左列,但中间有断档

⚠️ 场景六:最左列是范围查询

总结与最佳实践


什么是联合索引?

首先,要理解最左匹配原则,得先知道什么是联合索引。

  • 单列索引:只针对一个表列创建的索引。例如,为 users 表的 name 字段创建一个索引。
  • 联合索引:也叫复合索引,是针对多个表列创建的索引。例如,为 users 表的 (last_name, first_name) 两个字段创建一个联合索引。

这个索引的结构可以想象成类似于电话簿或字典。电话簿是先按姓氏排序,在姓氏相同的情况下,再按名字排序。你无法直接跳过姓氏,快速找到一个特定的名字。

什么是最左匹配原则?

最左匹配原则指的是:在使用联合索引进行查询时,MySQL/SQL数据库从索引的最左前列开始,并且不能跳过中间的列,一直向右匹配,直到遇到范围查询(><BETWEENLIKE)就会停止匹配。

这个原则决定了你的 SQL 查询语句是否能够使用以及如何高效地使用这个联合索引。

核心要点:
  1. 从左到右:索引的使用必须从最左边的列开始。
  2. 不能跳过:不能跳过联合索引中的某个列去使用后面的列。
  3. 范围查询右停止:如果某一列使用了范围查询,那么它右边的列将无法使用索引进行进一步筛选。

举例说明

假设我们有一个 users 表,并创建了一个联合索引 idx_name_age,包含 (last_name, age) 两个字段。

id

last_name

first_name

age

city

1

Wang

Lei

20

Beijing

2

Zhang

Wei

25

Shanghai

3

Wang

Fang

22

Guangzhou

4

Li

Na

30

Shenzhen

5

Zhang

San

28

Beijing

索引 idx_name_age 在磁盘上大致是这样排序的(先按 last_name 排序,last_name 相同再按 age 排序):

(Li, 30) (Wang, 20) (Wang, 22) (Zhang, 25) (Zhang, 28)

现在,我们来看不同的查询场景:

场景一:完全匹配最左列
SELECT * FROM users WHERE last_name = 'Wang';
  • 分析:查询条件包含了索引的最左列 last_name
  • 索引使用情况:✅ 可以使用索引。数据库可以快速在索引树中找到所有 last_name = 'Wang' 的记录((Wang, 20)(Wang, 22))。
场景二:匹配所有列
SELECT * FROM users WHERE last_name = 'Wang' AND age = 22;
  • 分析:查询条件包含了索引的所有列,并且顺序与索引定义一致。
  • 索引使用情况:✅ 可以高效使用索引。数据库先定位到 last_name = 'Wang',然后在这些结果中快速找到 age = 22 的记录。
场景三:匹配最左连续列
SELECT * FROM users WHERE last_name = 'Zhang';
  • 分析:虽然只用了 last_name,但它是索引的最左列。
  • 索引使用情况:✅ 可以使用索引。和场景一类似。
场景四:跳过最左列
SELECT * FROM users WHERE age = 25;
  • 分析:查询条件没有包含索引的最左列 last_name
  • 索引使用情况:❌ 无法使用索引。这就像让你在电话簿里直接找所有叫“伟”的人,你必须翻遍整个电话簿,也就是全表扫描
⚠️ 场景五:包含最左列,但中间有断档
-- 假设我们有一个三个字段的索引 (col1, col2, col3) -- 查询条件为 WHERE col1 = 'a' AND col3 = 'c';
  • 分析:虽然包含了最左列 col1,但跳过了 col2 直接查询 col3
  • 索引使用情况:✅ 部分使用索引。数据库只能使用 col1 来缩小范围,找到所有 col1 = 'a' 的记录。对于 col3 的过滤,它无法利用索引,需要在第一步的结果集中进行逐行筛选。
⚠️ 场景六:最左列是范围查询
SELECT * FROM users WHERE last_name > 'Li' AND age = 25;
  • 分析:最左列 last_name 使用了范围查询 >
  • 索引使用情况:✅ 部分使用索引。数据库可以使用索引找到所有 last_name > 'Li' 的记录(即从 Wang 开始往后的所有记录)。但是,对于 age = 25 这个条件,由于 last_name 已经是范围匹配,age 列在索引中是无序的,因此数据库无法再利用索引对 age 进行快速筛选,只能在 last_name > 'Li' 的结果集中逐行检查 age

总结与最佳实践

最左匹配原则的本质是由索引的数据结构(B+Tree) 决定的。索引按照定义的字段顺序构建,所以必须从最左边开始才能利用其有序性。

如何设计好的联合索引?

  1. 高频查询优先:将最常用于 WHERE 子句的列放在最左边。
  2. 等值查询优先:将经常进行等值查询(=)的列放在范围查询(><LIKE)的列左边。
  3. 覆盖索引:如果查询的所有字段都包含在索引中(即覆盖索引),即使不符合最左前缀,数据库也可能直接扫描索引来避免回表,但这通常发生在二级索引扫描中,效率依然不如最左匹配。

如果小假的内容对你有帮助,请点赞评论收藏。创作不易,大家的支持就是我坚持下去的动力!

Read more

MySQL 安装配置(完整教程)

MySQL 安装配置(完整教程)

文章目录 * 一、MySQL 简介 * 二、下载 MySQL * 三、安装 MySQL * 四、配置环境变量 * 五、配置 MySQL * 5.1 初始化 MySQL * 5.2 搭建 MySQL 环境 * 六、修改 MySQL 密码 * 七、卸载 MySQL * 八、结语 一、MySQL 简介 MySQL 是一款广泛使用的开源关系型数据库管理系统(RDBMS),由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司旗下产品。 发展历史: * MySQL 于 1995

By Ne0inhk
大数据新视界 -- Impala 性能优化:分布式环境中的优化新视野(下)(28 / 30)

大数据新视界 -- Impala 性能优化:分布式环境中的优化新视野(下)(28 / 30)

💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。💖💖💖 本博客的精华专栏: 1. 大数据新视界专栏系列:聚焦大数据,展技术应用,推动进步拓展新视野。 2. Java 大厂面试专栏系列:提供大厂面试的相关技巧和经验,助力求职。 3. Python 魅力之旅:探索数据与智能的奥秘专栏系列:走进 Python 的精彩天地,感受数据处理与智能应用的独特魅力。 4. Java 性能优化传奇之旅:铸就编程巅峰之路:如一把神奇钥匙,深度开启 JVM 等关键领域之门。丰富案例似璀璨繁星,引领你踏上编程巅峰的壮丽征程。 5. Java 虚拟机(

By Ne0inhk
Flutter for OpenHarmony 实战:Hive CE — 极速 NoSQL 本地存储

Flutter for OpenHarmony 实战:Hive CE — 极速 NoSQL 本地存储

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net 前言 在 Flutter for OpenHarmony 应用开发中,数据持久化是构建流畅体验的核心基石。无论是用户的登录状态、应用主题偏好,还是海量的离线缓存数据,都需要一套既快速又可靠的存储方案。 传统的 SQLite 虽然功能强大,但在处理简单的键值对(Key-Value)时往往显得过于沉重。Hive CE (Community Edition) 凭借其纯 Dart 编写、读写性能卓越的优势,成为了鸿蒙开发者的首选。本文将结合鸿蒙插件适配的最佳实践,带你构建一个工业级的加密存储方案。 一、Hive CE 的底层优势解析 1.1 纯 Dart 的并行优势 Hive 完全由 Dart 实现。在鸿蒙系统上,这意味着它避开了复杂的 JNI 调用开销。

By Ne0inhk