【C++】AVL 树平衡二叉搜索的神奇结构,代码实现全解析,从概念到应用,助你轻松掌握这一高效数据结构,编程能力更上一层楼!
🌟个人主页:落叶
🌟当前专栏:C++专栏
目录
AVL树实现
AVL的概念
AVL树是最先发明的⾃平衡⼆叉查找树,AVL是⼀颗空树,或者具备下列性质的⼆叉搜索树:它的 左右⼦树都是AV树,且左右⼦树的⾼度差的绝对值不超过1。AVL树是⼀颗⾼度平衡搜索⼆叉树, 通过控制⾼度差去控制平衡。AVL树得名于它的发明者G. M. Adelson-Velsky和E. M. Landis是两个前苏联的科学家,他们在1962 年的论文《An algorithm for the organization of information》中发表了它。 AVL树实现这⾥我们引⼊⼀个平衡因⼦(balance factor)的概念,每个结点都有⼀个平衡因⼦,任何 结点的平衡因⼦等于右⼦树的⾼度减去左⼦树的⾼度,也就是说任何结点的平衡因⼦等于0/1/-1, AVL树并不是必须要平衡因⼦,但是有了平衡因⼦可以更⽅便我们去进⾏观察和控制树是否平衡, 就像⼀个⻛向标⼀样。思考⼀下为什么AVL树是⾼度平衡搜索⼆叉树,要求⾼度差不超过1,⽽不是⾼度差是0呢?0不是更 好的平衡吗?画画图分析我们发现,不是不想这样设计,⽽是有些情况是做不到⾼度差是0的。⽐ 如⼀棵树是2个结点,4个结点等情况下,⾼度差最好就是1,⽆法作为⾼度差是0 AVL树整体结点数量和分布和完全⼆叉树类似,⾼度可以控制在logN,那么增删查改的效率也可 以控制在 O(logN),相⽐⼆叉搜索树有了本质的提升。
AVL树

下面这个就不是AVL树了

AVL树的实现
AVL树的结构
//节点 template<class K,class V> struct AVLtreeNode { pair<K, V> _kv; //值 AVLtreeNode<K, V>* _left; //左子树 AVLtreeNode<K, V>* _right; //右子树 AVLtreeNode<K, V>* _parent; //父节点 int _bf; //平衡因子 AVLtreeNode(const pair<K,V>& kv) :_kv(kv) ,_left(nullptr) ,_right(nullptr) ,_parent(nullptr) ,_bf(0) {} }; template<class K, class V> class AVLTree { //重命名为Node typedef AVLTreeNode<K, V> Node; public: //... private: Node* _root = nullptr; };AVL树的插⼊
AVL树插⼊⼀个值的⼤概过程
插⼊⼀个值按⼆叉搜索树规则进⾏插⼊。新增结点以后,只会影响祖先结点的⾼度,也就是可能会影响部分祖先结点的平衡因⼦,所以更新 从新增结点->根结点路径上的平衡因⼦,实际中最坏情况下要更新到根,有些情况更新到中间就可 以停⽌了,具体情况我们下⾯再详细分析。更新平衡因⼦过程中没有出现问题,则插⼊结束更新平衡因⼦过程中出现不平衡,对不平衡⼦树旋转,旋转后本质调平衡的同时,本质降低了⼦树 的⾼度,不会再影响上⼀层,所以插⼊结束。
平衡因⼦更新
更新原则:
平衡因⼦ = 右⼦树⾼度-左⼦树⾼度 只有⼦树⾼度变化才会影响当前结点平衡因⼦。插⼊结点,会增加⾼度,所以新增结点在parent的右⼦树,parent的平衡因⼦++,新增结点在 parent的左⼦树,parent平衡因⼦-- parent所在⼦树的⾼度是否变化决定了是否会继续往上更新
更新停⽌条件:
更新后parent的平衡因⼦等于0,更新中parent的平衡因⼦变化为-1->0 或者 1->0,说明更新前 parent⼦树⼀边⾼⼀边低,新增的结点插⼊在低的那边,插⼊后parent所在的⼦树⾼度不变,不会 影响parent的⽗亲结点的平衡因⼦,更新结束。更新后parent的平衡因⼦等于1 或 -1,更新前更新中parent的平衡因⼦变化为0->1 或者 0->-1,说 明更新前parent⼦树两边⼀样⾼,新增的插⼊结点后,parent所在的⼦树⼀边⾼⼀边低,parent所 在的⼦树符合平衡要求,但是⾼度增加了1,会影响arent的⽗亲结点的平衡因⼦,所以要继续向上 更新。更新后parent的平衡因⼦等于2 或 -2,更新前更新中parent的平衡因⼦变化为1->2 或者 -1->-2,说 明更新前parent⼦树⼀边⾼⼀边低,新增的插⼊结点在⾼的那边,parent所在的⼦树⾼的那边更⾼ 了,破坏了平衡,parent所在的⼦树不符合平衡要求,需要旋转处理,旋转的⽬标有两个:1、把 parent⼦树旋转平衡。2、降低parent⼦树的⾼度,恢复到插⼊结点以前的⾼度。所以旋转后也不 需要继续往上更新,插⼊结束。
更新到10结点,平衡因⼦为2,10所在的⼦树已经不平衡,需要旋转处理

更新到中间结点3,平衡因子为0,3为根的⼦树⾼度不变,不会影响上⼀层,更新结束

最坏更新到根停⽌

插⼊结点及更新平衡因⼦的代码实现
//节点 template<class K,class V> struct AVLtreeNode { pair<K, V> _kv; //值 AVLtreeNode<K, V>* _left; //左子树 AVLtreeNode<K, V>* _right; //右子树 AVLtreeNode<K, V>* _parent; //父节点 int _bf; //平衡因子 AVLtreeNode(const pair<K,V>& kv) :_kv(kv) ,_left(nullptr) ,_right(nullptr) ,_parent(nullptr) ,_bf(0) {} }; template<class K,class V> class AVLtree { typedef AVLtreeNode<K, V> Node; public: //插入 bool insert(const pair<K, V>& kv) { if (_root == nullptr) { _root = new Node(kv); return true; } Node* cur = _root; Node* par = nullptr; //走到空 while (cur) { //小于往左走 if (kv.first < cur->_kv.first) { par = cur; cur = cur->_left; } //大于往右走 else if (kv.first > cur->_kv.first) { par = cur; cur = cur->_right; } else { return false; } } //判断该插入左边还是右边 cur = new Node(kv); if (kv.first < par->_kv.first) { par->_left = cur; } else { par->_right = cur; } //连接父亲节点 cur->_parent = par; //更新平衡因子 while (par != nullptr) { //是左子树平衡因子就-- if (par->_left == cur) { par->_bf--; } else //是右子树平衡因子就++ { par->_bf++; } if (par->_bf == 0) { //更新结束 break; } else if (par->_bf == 1 || par->_bf == -1) { //继续向上更新 cur = par; par = par->_parent; } else if (par->_bf == 2 || par->_bf == -2) { //不平衡,旋转处理 //旋转完结束循环 break } else { //其他数值就说明有问题,assert报错 assert(false); } } return true; } private: Node* _root = nullptr; };旋转
旋转的原则
1. 保持搜索树的规则
2. 让旋转的树从不满⾜变平衡,其次降低旋转树的⾼度 旋转总共分为四种,左单旋/右单旋/左右双旋/右左双旋。 说明:下⾯的图中,有些结点我们给的是具体值,如10和5等结点,这⾥是为了⽅便讲解,实际中是什 么值都可以,只要⼤⼩关系符合搜索树的规则即可。
右单旋
本图1展⽰的是10为根的树,有a/b/c抽象为三棵⾼度为h的⼦树(h>=0),a/b/c均符合AVL树的要 求。10可能是整棵树的根,也可能是⼀个整棵树中局部的⼦树的根。这⾥a/b/c是⾼度为h的⼦树, 是⼀种概括抽象表⽰,他代表了所有右单旋的场景,实际右单旋形态有很多种,具体图2/图3/图4/ 图5进⾏了详细描述。在a⼦树中插⼊⼀个新结点,导致a⼦树的⾼度从h变成h+1,不断向上更新平衡因⼦,导致10的平 衡因⼦从-1变成-2,10为根的树左右⾼度差超过1,违反平衡规则。10为根的树左边太⾼了,需要 往右边旋转,控制两棵树的平衡。旋转核⼼步骤,因为5<b⼦树的值<10,将b变成10的左⼦树,10变成5的右⼦树,5变成这棵树新的根,符合搜索树的规则,控制了平衡,同时这棵的⾼度恢复到了插⼊之前的h+2,符合旋转原则。如果插⼊之前10整棵树的⼀个局部⼦树,旋转后不会再影响上⼀层,插⼊结束了。
