高阶数据结构:并查集
前言
在很多工程与算法问题中,我们经常会遇到这样一类场景:
需要将一堆元素动态划分成若干个互不相交的集合,并支持:查询某个元素属于哪个集合、判断两个元素是否属于同一集合、合并两个集合。
这类问题如果用普通数组或树来处理,往往复杂且低效。而**并查集(Union-Find Set)**正是为此类问题量身定制的高效数据结构。
一、什么是并查集
在一些应用问题中,需要将 n 个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。
适合于描述这类问题的抽象数据类型称为并查集 (union-find set)。
并查集是一种树型结构的数据结构,用来维护若干个不相交集合。
它支持三种核心操作:
| 核心操作 | 说明 |
|---|---|
Find | 查找某元素属于哪个集合 |
Union | 合并两个集合 |
IsInSet | 判断两个元素是否在同一集合 |
适合描述'集合合并 + 归属查询'问题的抽象数据类型,称为并查集(
Union-Find Set)。
二、并查集的原理理解
比如:某公司今年校招全国总共招生 10 人,西安招 4 人,成都招 3 人,武汉招 3 人,10 个人来自不同的学校,起先互不相识,每个学生都是一个独立的小团体,现给这些学生进行编号:{0, 1, 2, 3, 4, 5, 6, 7, 8, 9};
用以下数组用来存储该小集体,数组中的数字代表:该小集体中具有成员的个数。(负号下文解释)
毕业后,学生们要去公司上班,每个地方的学生自发组织成小分队一起上路,于是:
西安学生小分队 s1={0,6,7,8},成都学生小分队 s2={1,4,9},武汉学生小分队 s3={2,3,5} 就相互认识了,10 个人形成了三个小团体。假设由 0, 1, 2 担任队长,负责大家的出行。
从上图可以看出:编号 6, 7, 8 同学属于 0 号小分队,该小分队中有 4 人 (包含队长 0);
编号为 4 和 9 的同学属于 1 号小分队,该小分队有 3 人 (包含队长 1);
编号为 3 和 5 的同学属于 2 号小分队,该小分队有 3 个人 (包含队长 2)。
仔细观察数组中内容,可以得出以下结论:
- 数组的下标对应集合中元素的编号
- 数组中如果为负数,负号代表根,数字代表该集合中元素个数
- 数组中如果为非负数,代表该元素双亲在数组中的下标
在公司工作一段时间后,西安小分队中 8 号同学与成都小分队 1 号同学奇迹般的走到了一起,两个小圈子的学生相互介绍,最后成为了一个小圈子。
现在 0 集合有 7 个人,2 集合有 3 个人,总共两个朋友圈。
通过以上例子可知,并查集一般可以解决以下问题:
- 查找元素属于哪个集合
沿着数组表示树形关系往上一直找到根 (即:树中中元素为负数的位置)


