《回溯 C++98:string 核心机制拆解 —— 从拷贝策略到高效 swap》

《回溯 C++98:string 核心机制拆解 —— 从拷贝策略到高效 swap》

🔥草莓熊Lotso:个人主页

❄️个人专栏:《C++知识分享》《Linux 入门到实践:零基础也能懂》

生活是默默的坚持,毅力是永久的享受。


🎬博主简介:


目录

前言:

一. 字符串的拷贝机制:从浅拷贝到写时拷贝

1.1 浅拷贝:隐藏的 “双重释放” 陷阱

1.2 深拷贝:独立内存的安全保障

1.2.1 传统版写法的string类

1.2.2 现代版写法的string类

1.3 写时拷贝(了解就可以):读写分离的优化策略

二、C++98/03 中的三种 swap 实现

2.1 成员函数 swap:O (1) 级别的高效交换

2.2 全局 swap(默认实现):低效的拷贝交换

2.3 全局 swap(优化版本):复用成员 swap 的高效实现

三、总结:拷贝与交换的设计巧思

结尾:


前言:

在 C++11 引入移动语义之前,std::string的实现依赖于深拷贝、写时拷贝(Copy-On-Write)等经典内存管理策略,而swap 操作则是提升性能的关键优化点。本文聚焦 C++11 之前string的三大swap实现与拷贝机制,带你理解早期字符串类设计的核心智慧。

一. 字符串的拷贝机制:从浅拷贝到写时拷贝

字符串的拷贝是内存管理的核心场景,错误的拷贝实现会导致内存泄漏或程序崩溃,而优化的拷贝策略则能显著提升性能。

1.1 浅拷贝:隐藏的 “双重释放” 陷阱

浅拷贝是最直观但危险的拷贝方式,其本质是仅复制指针地址而非实际数据,导致多个对象共享同一块内存。

问题展现:

namespace Lotso { class string { private: char* _str; size_t _size; public: // 构造函数:分配内存并初始化 string(const char*) : _size(strlen(str)) { _str = new char[_size + 1]; strcpy(_str, str); } // 未实现深拷贝,使用编译器默认的浅拷贝 ~string() { delete[] _str; } // 析构时释放内存 }; // 崩溃 int main() { string s1("hello"); string s2 = s1; // 浅拷贝:s1._str 与 s2._str 指向同一块内存 return 0; // 析构时:s2 先释放内存,s1 再释放已被释放的内存→两个释放同一块内存程序崩溃 } }; 

问题根源:就像一个家庭中有两个孩子,但父母只买了一份玩具,两个孩子愿意一块玩,则万事大吉,万一不想分享就你争我夺,玩具损坏。

可以采用深拷贝解决浅拷贝问题,即:每个对象都有一份独立的资源,不要和其他对象共享。父母给每个孩子都买一份玩具,各自玩各自的就不会有问题了。

1.2 深拷贝:独立内存的安全保障

深拷贝通过为每个对象分配独立内存并复制数据,彻底避免资源共享,是最安全的拷贝方式。

1.2.1 传统版写法的string类

class String { public: String(const char*) { // 构造String类对象时,如果传递nullptr指针,可以认为程序非 if (nullptr == str) { assert(false); return; } _str = new char[strlen(str) + 1]; strcpy(_str, str); } String(const String& s) : _str(new char[strlen(s._str) + 1]) { strcpy(_str, s._str); } String& operator=(const String& s) { if (this != &s) { char* pStr = new char[strlen(s._str) + 1]; strcpy(pStr, s._str); delete[] _str; _str = pStr; } return *this; } ~String() { if (_str) { delete[] _str; _str = nullptr; } } private: char* _str; };

优势:每个对象拥有独立内存,析构时不会冲突;

缺点:每次拷贝都需分配内存和复制数据,效率较低(O (n) 时间复杂度)

1.2.2 现代版写法的string类

class String { public: String(const char*) { if (nullptr == str) { assert(false); return; } _str = new char[strlen(str) + 1]; strcpy(_str, str); } String(const String& s) : _str(nullptr) { String strTmp(s._str); swap(_str, strTmp._str); } // 对比下和上面的赋值那个实现比较好? String& operator=(String s) { swap(_str, s._str); return *this; } /* String& operator=(const String& s) { if(this != &s) { String strTmp(s); swap(_str, strTmp._str); } return *this; } */ ~String() { if (_str) { delete[] _str; _str = nullptr; } } private: char* _str; };

核心逻辑:借助临时对象的深拷贝,通过swap将临时对象的资源 “转移” 到当前对象,临时对象析构时会自动释放原对象的旧内存,既避免数据丢失,又简化代码。

1.3 写时拷贝(了解就可以):读写分离的优化策略

  • 写时拷贝就是一种拖延症,是在浅拷贝的基础之上增加了引用计数的方式来实现的。
  • 引用计数:用来记录资源使用者的个数。在构造时,将资源的计数给成1,每增加一个对象使用该资源,就给计数增加1,当某个对象被销毁时,先给该计数减1,然后再检查是否需要释放资源,如果计数为1,说明该对象时资源的最后一个使用者,将该资源释放;否则就不能释放,因为还有其他对象在使用该资源。
推荐两篇大佬的文章:

C++ STL string的Copy-On-Write技术 | 酷 壳 - CoolShell

https://coolshell.cn/articles/1443.html扩展阅读:

C++面试中string类的一种正确写法 | 酷 壳 - CoolShell

STL 的string类怎么啦?_string拥有庞大字符串 c++-ZEEKLOG博客

二、C++98/03 中的三种 swap 实现

  • swap用于交换两个字符串的内容,不同实现的效率差异显著,核心是 “是否避免数据拷贝”。

2.1 成员函数 swap:O (1) 级别的高效交换

string类的成员swap直接交换底层资源(指针、大小、引用计数等),不涉及数据拷贝,是效率最高的实现。

代码实现:

class String { public: void swap(String& s) { // 交换核心成员,无数据拷贝 std::swap(_str, s._str); std::swap(_size, s._size); std::swap(_capacity, s._capacity); } private: char* _str; size_t _size; size_t _capacity; };

优势

  • 效率极致:无论字符串长度如何,均为 O (1) 时间复杂度;
  • 无内存风险:交换后资源所有权转移,析构时各自释放原有资源。

2.2 全局 swap(默认实现):低效的拷贝交换

C++ 标准库提供的全局std::swap模板,默认逻辑是 “拷贝 - 覆盖 - 析构”,对字符串而言效率极低。

代码实现:

template <class T> void swap(T& a, T& b) { T c(a);// 深拷贝 a 到临时对象(O(n) a = b; //深拷贝 b 到 a(O(n)) b = c;// 深拷贝临时对象到 b(O(n)) }

问题:对长字符串而言,三次深拷贝会导致 O (n) 时间复杂度,性能极差。

2.3 全局 swap(优化版本):复用成员 swap 的高效实现

为解决默认swap的低效问题,标准库会为std::string提供模板特化,直接调用成员swap,将效率提升至 O (1)。

代码实现:

inline void swap(string& a, string& b) { //还是调的库里的 a.swap(b); }

优势:兼顾通用性与效率,在模板函数(如排序算法)中使用试探大std::swap时,仍能享受高效交换。

三、总结:拷贝与交换的设计巧思

在 C++11 之前,string的设计围绕 “内存效率” 与 “安全性” 展开:

拷贝机制的选择

  • 深拷贝:安全但低效,适合写操作频繁的场景;
  • 写时拷贝:读多写少场景下的优化,但存在线程安全与迭代器失效问题,现代编译器已逐渐弃用。

swap 实现的最优实践

  • 优先使用成员swap:直接交换资源,效率最高;
  • 全局swap优化:标准库已帮我们优化,无需手动实现,但需知道其底层依赖成员swap的本质。

结尾:

往期回顾:

《告别 “会用不会讲”:C++ string 底层原理拆解 + 手撕实现,面试 / 开发都适用》

结语:回溯 C++98/03 string 的拷贝与 swap 机制,既是理解早期内存管理智慧的钥匙,也为掌握现代 C++ 容器设计打下根基。

✨把这些内容吃透超牛的!放松下吧✨
ʕ˘ᴥ˘ʔ
づきらど


Read more

MySQL 高频面试题(由浅到深 完整版,面试必背)

MySQL 高频面试题(由浅到深 完整版,面试必背)

一、基础核心篇(初级 / 中级必问,重中之重,面试保底分,占比 40%) 1. MySQL 是什么?核心特点有哪些?         答案要点 MySQL 是一款开源的关系型数据库(RDBMS),基于 SQL 语言,主打轻量、高性能、高可用、易部署,是互联网行业首选的数据库(电商、金融、社交等 90% 以上业务都在用)。核心特点: 1. 支持关系型数据库特性:ACID 事务、外键、约束、多表关联查询。 2. 高性能:底层优化优秀,支持海量数据存储,单表千万级数据查询依然高效。 3. 多存储引擎:支持插件式引擎,最常用 InnoDB(默认)、MyISAM。 4.

By Ne0inhk
运维效率翻倍!Ansible 批量部署 Nginx 的实战心得

运维效率翻倍!Ansible 批量部署 Nginx 的实战心得

前言 作为一名常年和服务器打交道的运维人员,我曾无数次被批量部署软件的工作折磨得焦头烂额。上百台服务器,手动逐台登录、安装、配置,不仅耗时耗力,还总免不了因为手抖输错命令,导致某几台机器的配置出问题,后续排查又要花费大把时间。直到接触并用上 Ansible,才真正体会到 “解放双手” 的滋味。 用 Ansible 最大的感受就是省心,它不用在目标服务器装额外的代理程序,靠 SSH 就能通信,上手也快,写好一次 Playbook,不管是几十台还是上百台服务器,一条命令就能完成标准化部署,而且重复执行也不会出问题,完美解决了手动操作的一致性难题。还有一次假期,公司临时要给内网服务器部署 Nginx,我本以为得赶回公司,结果用 cpolar 做了内网穿透,在家就能远程用 Ansible 完成部署,那一刻真的觉得选对工具太重要了。 好东西当然要和同行们分享,下面就把这套用 Ansible 自动化部署 Nginx 的完整流程整理出来,从 Ansible 安装到借助

By Ne0inhk
【MySQL】数据库表的操作

【MySQL】数据库表的操作

MySQL数据库表的操作 * MySQL表的操作 * github地址 * 0. 前言 * 1. 创建表 * 2. 查看表与表结构 * 查看已有表 * 查看表的具体结构 * 查看表创建时的使用的命令 * 3. 修改表 * 修改表名 * 修改表的属性 * 在表中添加列 * 在表中修改列属性 * 在表中删除列 * 修改表的列名 * 4. 删除表 * 用法 * 注意与危害 * 🧨 一、数据不可恢复 * ⚙️ 二、表结构丢失 * 💣 三、可能导致依赖关系破坏 * 🕳 四、日志与恢复机制受限 * ⚡ 五、误操作风险高 * ✅ 安全建议 * 5. 结语 MySQL表的操作 github地址 有梦想的电信狗 0. 前言 在学习 MySQL 的过程中,“表”是数据库操作的核心对象。 无论是存储用户信息、记录日志、还是管理订单数据,

By Ne0inhk
2025年PostgreSQL 详细安装教程(windows)

2025年PostgreSQL 详细安装教程(windows)

前言 PostgreSQL 是一个功能强大的开源关系型数据库管理系统(ORDBMS),以下是对它的全面介绍: 基本概况 * 名称:通常简称为 "Postgres" * 类型:对象-关系型数据库管理系统 * 许可:开源,采用类MIT许可证 * 首次发布:1996年(起源于1986年的POSTGRES项目) * 最新版本:PostgreSQL 16(截至2023年9月发布) 核心特性 1. 标准兼容性 * 完全符合ACID(原子性、一致性、隔离性、持久性) * 高度兼容SQL标准 2. 高级功能 * 复杂查询 * 外键 * 触发器 * 可更新视图 * 事务完整性 * 多版本并发控制(MVCC) 3. 扩展性 * 支持自定义数据类型 * 自定义函数 * 使用不同编程语言编写代码(如PL/pgSQL, PL/Python,

By Ne0inhk