C++手撕红黑树:从0到200行,拿下STL map底层核心

C++手撕红黑树:从0到200行,拿下STL map底层核心

文章目录

C++手撕红黑树:从0到200行,拿下STL map底层核心

1. 红黑树的概念

红黑树是一棵二叉搜索树,它的每个结点增加一个存储位来表示结点的颜色,可以是红色或者黑色。通过对任何一条从根到叶子的路径上各个结点的颜色进行约束,红黑树确保没有一条路径会比其他路径长出2倍,因而是接近平衡的。

1.1 红黑树的规则

  1. 每个结点不是红色就是黑色。
  2. 根结点是黑色的。
  3. 如果一个结点是红色的,则它的两个孩子结点必须是黑色的(即任意一条路径不会有连续的红色结点)。
  4. 对于任意一个结点,从该结点到其所有 NULL 结点的简单路径上,均包含相同数量的黑色结点。
说明:《算法导论》等书籍中补充了“每个叶子结点(NIL)都是黑色的”规则。这里所指的叶子结点不是传统意义上的叶子结点,而是我们说的空结点(NIL),也叫外部结点。引入 NIL 是为了准确标识所有路径,但在实现细节中通常忽略 NIL 结点,了解概念即可。

在这里插入图片描述


在这里插入图片描述

1.2 红黑树如何确保最长路径不超过最短路径的2倍?

  • 由规则4可知,从根到 NULL 结点的每条路径都有相同数量的黑色结点。极端场景下,最短路径一定是全为黑色结点的路径,假设最短路径长度为 bh(black height)。
  • 由规则2和规则3可知,任意一条路径不会有连续的红色结点。极端场景下,最长路径就是一黑一红间隔组成,那么最长路径的长度为 2 * bh
  • 综合红黑树的4点规则,理论上的全黑最短路径和一黑一红的最长路径并不一定在每棵红黑树中都存在。假设任意一条从根到 NULL 结点的路径长度为 h,那么 bh <= h <= 2 * bh

1.3 红黑树的效率

假设 N 是红黑树中结点数量,h 是最短路径的长度,那么:

2^h - 1 <= N <= 2^(2*h) - 1

由此推出 h ≈ logN,即红黑树增删查改的最坏情况是走最长路径 2*logN,时间复杂度仍为 O(logN)

红黑树的表达相对 AVL 树要抽象一些。AVL 树通过高度差直观地控制平衡,而红黑树通过4条规则的颜色约束间接实现了近似平衡。两者效率属于同一档次,但红黑树在插入相同数量的结点时旋转次数更少,因为它对平衡的控制没那么严格。


在这里插入图片描述

2. 红黑树的实现

2.1 红黑树的结构

// 枚举值表示颜色enumColour{ RED, BLACK };// 这里默认按 key/value 结构实现template<classK,classV>structRBTreeNode{// 更新控制平衡需要加入 parent 指针 pair<K, V> _kv; RBTreeNode<K, V>* _left; RBTreeNode<K, V>* _right; RBTreeNode<K, V>* _parent; Colour _col;RBTreeNode(const pair<K, V>& kv):_kv(kv),_left(nullptr),_right(nullptr),_parent(nullptr){}};template<classK,classV>classRBTree{typedef RBTreeNode<K, V> Node;public:// ...private: Node* _root =nullptr;};

2.2 红黑树的插入

2.2.1 插入的大概过程

  1. 按二叉搜索树规则插入新结点。
  2. 如果是空树插入,新增结点为黑色;如果是非空树插入,新增结点必须为红色(否则会破坏规则4)。
  3. 非空树插入后,如果父亲结点是黑色,则插入结束;如果父亲结点是红色,则违反规则3,需要进一步处理。
约定c 为当前结点(cur),p 为父亲(parent),g 为祖父(grandfather),u 为叔叔(uncle,即 p 的兄弟)。

2.2.2 情况1:变色

条件c 为红,p 为红,g 为黑,u 存在且为红。
处理:将 pu 变黑,g 变红,然后把 g 当作新的 c,继续往上更新。

  • 无论 cp 的左还是右,pg 的左还是右,处理方法相同。

如果 g 是根,最后再将 g 变回黑色。

在这里插入图片描述

2.2.3 情况2:单旋 + 变色

条件c 为红,p 为红,g 为黑,u 不存在或为黑。

  • 如果 u 不存在,c 一定是新增结点。
  • 如果 u 存在且为黑,c 一定不是新增,而是由情况1变色更新上来的。

处理

  • pg 的左,cp 的左:以 g 为旋转点进行右单旋,再将 p 变黑,g 变红。

pg 的右,cp 的右:以 g 为旋转点进行左单旋,再将 p 变黑,g 变红。

在这里插入图片描述

2.2.4 情况3:双旋 + 变色

条件c 为红,p 为红,g 为黑,u 不存在或为黑,且 cp 的方向不一致。

处理

  • pg 的左,cp 的右:先以 p 为旋转点进行左单旋,再以 g 为旋转点进行右单旋,最后将 c 变黑,g 变红。

pg 的右,cp 的左:先以 p 为旋转点进行右单旋,再以 g 为旋转点进行左单旋,最后将 c 变黑,g 变红。

在这里插入图片描述

2.3 红黑树的插入代码实现

boolInsert(const pair<K, V>& kv){if(_root ==nullptr){ _root =newNode(kv); _root->_col = BLACK;returntrue;} Node* parent =nullptr; Node* cur = _root;while(cur){if(cur->_kv.first < kv.first){ parent = cur; cur = cur->_right;}elseif(cur->_kv.first > kv.first){ parent = cur; cur = cur->_left;}else{returnfalse;}} cur =newNode(kv); cur->_col = RED;// 新增结点为红色if(parent->_kv.first < kv.first){ parent->_right = cur;}else{ parent->_left = cur;} cur->_parent = parent;while(parent && parent->_col == RED){ Node* grandfather = parent->_parent;if(parent == grandfather->_left){ Node* uncle = grandfather->_right;if(uncle && uncle->_col == RED){// 情况1:叔叔存在且为红 parent->_col = uncle->_col = BLACK; grandfather->_col = RED; cur = grandfather; parent = cur->_parent;}else{// 情况2/3:叔叔不存在或为黑if(cur == parent->_left){// 单旋RotateR(grandfather); parent->_col = BLACK; grandfather->_col = RED;}else{// 双旋RotateL(parent);RotateR(grandfather); cur->_col = BLACK; grandfather->_col = RED;}break;}}else{ Node* uncle = grandfather->_left;if(uncle && uncle->_col == RED){// 情况1:叔叔存在且为红 parent->_col = uncle->_col = BLACK; grandfather->_col = RED; cur = grandfather; parent = cur->_parent;}else{// 情况2/3:叔叔不存在或为黑if(cur == parent->_right){RotateL(grandfather); parent->_col = BLACK; grandfather->_col = RED;}else{RotateR(parent);RotateL(grandfather); cur->_col = BLACK; grandfather->_col = RED;}break;}}} _root->_col = BLACK;returntrue;}
旋转代码与 AVL 树相同,只需调整指针,无需更新平衡因子。

2.4 红黑树的查找

按二叉搜索树逻辑实现,时间复杂度 O(logN)

Node*Find(const K& key){ Node* cur = _root;while(cur){if(cur->_kv.first < key){ cur = cur->_right;}elseif(cur->_kv.first > key){ cur = cur->_left;}else{return cur;}}returnnullptr;}

2.5 红黑树的验证

不能简单地通过检查最长路径不超过最短路径2倍来验证,因为即使满足该条件,颜色规则也可能被破坏。必须检查4点规则:

  1. 根结点为黑色。
  2. 无连续红色结点。
  3. 每条路径黑色结点数量相同。
boolCheck(Node* root,int blackNum,constint refNum){if(root ==nullptr){if(refNum != blackNum){ cout <<"存在黑色结点数量不相等的路径"<< endl;returnfalse;}returntrue;}if(root->_col == RED && root->_parent->_col == RED){ cout << root->_kv.first <<"存在连续的红色结点"<< endl;returnfalse;}if(root->_col == BLACK){ blackNum++;}returnCheck(root->_left, blackNum, refNum)&&Check(root->_right, blackNum, refNum);}boolIsBalance(){if(_root ==nullptr)returntrue;if(_root->_col == RED)returnfalse;// 参考值:最左路径的黑色结点数int refNum =0; Node* cur = _root;while(cur){if(cur->_col == BLACK)++refNum; cur = cur->_left;}returnCheck(_root,0, refNum);}

Read more

【Python基础:语法第一课】Python 基础语法详解:变量、类型、动态特性与运算符实战,构建完整的编程基础认知体系

【Python基础:语法第一课】Python 基础语法详解:变量、类型、动态特性与运算符实战,构建完整的编程基础认知体系

🎬 个人主页:艾莉丝努力练剑 ❄专栏传送门:《C语言》《数据结构与算法》《C/C++干货分享&学习过程记录》 《Linux操作系统编程详解》《笔试/面试常见算法:从基础到进阶》《Python干货分享》 ⭐️为天地立心,为生民立命,为往圣继绝学,为万世开太平 🎬 艾莉丝的简介: 文章目录 * 1 ~> 常量和表达式 * 2 ~> 变量和类型 * 2.1 变量是什么 * 2.2 变量的语法 * 2.2.1 定义变量 * 2.2.2 使用变量 * 2.3 变量的类型:对于不同种类的变量作出区分 * 2.3.1 整数 * 2.

By Ne0inhk
AI的提示词专栏:Prompt 与 Python Pandas 的结合使用指南

AI的提示词专栏:Prompt 与 Python Pandas 的结合使用指南

AI的提示词专栏:Prompt 与 Python Pandas 的结合使用指南 该指南聚焦 Prompt 与 Pandas 结合的实践应用,先阐述二者结合的价值 —— 降低 Pandas 学习门槛、提升数据处理效率,接着梳理代码生成、解释、优化等 6 大核心应用场景及对应 Prompt 目标。随后详解高质量 Prompt 设计的五大原则,强调需精准描述数据结构、明确操作目标等要点。通过 5 个实战案例,从基础数据清洗到批量生成报表,展示 Prompt 设计、模型输出与结果验证全流程,并给出 8 个高频问题的解决方案。最后总结核心价值,提供扩展学习建议,助力读者掌握 “自然语言驱动数据处理” 能力,形成高效工作流。 人工智能专栏介绍     人工智能学习合集专栏是 AI 学习者的实用工具。它像一个全面的

By Ne0inhk
IPIDEA网页抓取API实战:全自动化实现eBay商品数据采集与Python接入

IPIDEA网页抓取API实战:全自动化实现eBay商品数据采集与Python接入

前言:跨境电商数据采集痛点与需求 随着跨境电商、数据驱动决策以及AI模型训练的需求不断增长,开发者与企业需要稳定、合规、可规模化 的网页数据抓取方案。但实际落地往往困难重重:高强度抓取、IP无法访问、JS渲染、数据格式不统一,这些让数据采集的技术门槛与成本居高不下。本篇将带你实操IPIDEA网页抓取API,并构建一个 可直接投入使用的eBay商品信息采集工具,一步步完成抓取、解析到下载的全过程,帮助你快速掌握全球电商数据采集的核心方法。 为什么需要网页抓取API 在跨境电商运营、市场竞品调研、AI模型训练等核心业务场景中,企业与开发者往往需要获取公开的电商商品信息、竞品动态等关键数据,但直接开展数据采集工作会面临三大核心痛点: 抓取门槛居高不下:Amazon、eBay等主流平台普遍部署了验证码校验、IP访问管理、JS动态渲染等多重抓取机制,若自研抓取系统,不仅需要持续投入人力进行技术突破与迭代,还会面临采集稳定性差、数据获取中断等问题,综合成本居高不下 合规风险难以规避:未经合规授权的公开数据采集行为,容易触碰GDPR、CCPA等国际数据合规法规;同时普通代理IP无法满足 “

By Ne0inhk
详解如何复现LLaMA 4:从零开始利用Python构建

详解如何复现LLaMA 4:从零开始利用Python构建

🧠 向所有学习者致敬! “学习不是装满一桶水,而是点燃一把火。” —— 叶芝 我的博客主页:https://lizheng.blog.ZEEKLOG.net 🌐 欢迎点击加入AI人工智能社区! 🚀 让我们一起努力,共创AI未来! 🚀 LLaMA 4 发布以来已经面临了大量的批评,但LLaMA 4 是继 Mistral 之后的一个新进展,展示了基于 MoE(Mixture-of-Experts,混合专家)模型的优势。 在本博客中,我们从零开始构建 LLaMA 4 的 MoE 架构,以了解它是如何实际构建的。 更多LLM图解内容可以查看 详解如何复现DeepSeek R1:从零开始利用Python构建 详解如何从零用 Python复现类似 GPT-4o 的多模态模型 复现BPE 以下是我们在GPU 上训练的 220 万参数的 LLaMA MoE 在一个微小的英语数据集上训练

By Ne0inhk