C++ CPU 的局部性原理与性能优化

CPU 的局部性原理是计算机体系结构的核心思想，分为时间局部性和空间局部性。时间局部性指近期访问的数据可能再次被访问，空间局部性指访问某地址后可能访问邻近地址。CPU 利用这一原理通过缓存（Cache）机制减少内存访问延迟。文章通过行优先与列优先遍历的代码对比，展示了内存访问模式对缓存命中率及程序性能的显著影响。理解局部性有助于进行代码层面的性能优化，如循环优化、数据结构布局调整等。

咸鱼开飞机发布于 2026/2/21更新于 2026/4/182 浏览

CPU 的局部性原理

在实际编程中，我们常会发现： 逻辑相同的代码，仅仅改变数据访问顺序，性能却可能相差数倍。

造成这种差异的根本原因，正是现代 CPU 的核心设计思想之一——局部性原理（Locality Principle）。

随着学习从'会写代码'走向'写出高性能代码'，我们会发现：真正影响程序速度的，往往不是算法本身，而是内存访问模式与缓存命中率。

本文将围绕局部性原理展开，系统讲解：

什么是局部性原理
时间局部性与空间局部性的区别
CPU 缓存如何利用局部性
代码访问方式为何会显著影响性能

帮助你理解程序性能与底层硬件之间的真实联系。

一、什么是局部性原理？

局部性原理（Locality Principle） 是指在程序运行过程中，所访问的指令和数据往往集中在较小的区域内，而不会随机分布在整个内存空间中。

换句话说：

程序的访问行为有'偏好'，更倾向于访问'刚刚访问过'或'靠近刚刚访问过'的内存区域。

这种规律来源于：

程序的控制结构（循环、函数调用）
数据结构的访问方式（数组、指针、链表等）
编译器生成代码的局部性优化

因此，CPU 可以利用这一规律，通过在缓存中保存近期访问的数据或指令，极大提高访问速度。

二、局部性原理的两种类型

1. 时间局部性（Temporal Locality）

如果一个数据项被访问过，那么它很可能在不久的将来再次被访问。

典型场景：

int sum = 0;
for (int i = 0; i < 1000; ++i) {
    sum += a[i];
}

变量 sum 每次循环都会被访问（修改一次、读取一次）。
数组 a[i] 的每个元素虽然只访问一次，但循环体代码在短时间内不断执行。

因此：

sum 展现了强时间局部性。
循环体指令也有时间局部性，因为 CPU 在短时间内反复执行同一段指令。

2. 空间局部性（Spatial Locality）

如果程序访问了某个地址的数据，那么它很可能在不久之后访问与该地址相邻的数据。

典型场景：

for (int i = 0; i < 1000; ++i) {
    sum += a[i];
}

当 CPU 访问 a[0] 时，极有可能紧接着访问 a[1]、……

层级	存储类型	访问延迟	容量	特征
寄存器	Register	~1ns	极小	位于 CPU 内部
一级缓存	L1 Cache	~2-4ns	KB 级	每个核心独享
二级缓存	L2 Cache	~10ns	MB 级	每核心或共享
三级缓存	L3 Cache	~30-40ns	数十 MB	多核共享
主内存	DRAM	~100ns	GB 级	访问慢
硬盘/SSD	Storage	>10⁶ns	TB 级	极慢

缓存机制	利用的局部性	示例
Cache line（缓存行）	空间局部性	一次加载连续 64 字节数据
Cache 替换策略（LRU）	时间局部性	最近使用的优先保留
Prefetch（预取机制）	空间局部性	预测程序下一个访问位置
分支预测（Branch Prediction）	时间局部性	预测指令执行路径

优化目标	对应局部性	示例策略
提高 Cache 命中率	时间 + 空间	减少随机访问，复用数据
编译器优化	时间	循环展开、函数内联
内存对齐	空间	避免跨 Cache line 访问
数据结构优化	空间	结构体紧凑排列、SoA 替代 AoS
多线程编程	时间 + 空间	减少伪共享（false sharing）

项目	时间局部性	空间局部性
定义	近期访问的数据可能再次被访问	访问某地址的数据后，可能访问邻近地址
典型表现	循环变量、计数器、函数调用	数组遍历、顺序读取文件
缓存利用	Cache 替换策略	Cache line 预取
程序优化	减少重复计算、循环优化	顺序访问、内存对齐

CPU 特性	依赖局部性	说明
分支预测（Branch Predictor）	时间局部性	程序的分支往往重复同样的路径
指令预取（Instruction Prefetch）	空间局部性	指令存储在连续地址中
超标量流水线（Superscalar Pipeline）	时间局部性	指令流局部集中，可乱序执行
Cache 多级设计	时间 + 空间	快速响应最近/邻近访问请求

C++ CPU 的局部性原理与性能优化

CPU 的局部性原理

一、什么是局部性原理？

二、局部性原理的两种类型

1. 时间局部性（Temporal Locality）

2. 空间局部性（Spatial Locality）

更多推荐文章

相关免费在线工具

三、为什么需要局部性原理？

四、缓存设计如何利用局部性？

五、代码层面如何体现局部性？

✅ 好的例子：行优先遍历（空间局部性强）

❌ 坏的例子：列优先遍历（空间局部性差）

六、局部性与性能优化的关系

七、直观示意图（逻辑图）

八、小结

九、延伸：局部性与现代 CPU 特性

🔹总结一句话

结语

C++ CPU 的局部性原理与性能优化

CPU 的局部性原理

一、什么是局部性原理？

二、局部性原理的两种类型

1. 时间局部性（Temporal Locality）

2. 空间局部性（Spatial Locality）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

三、为什么需要局部性原理？

四、缓存设计如何利用局部性？

五、代码层面如何体现局部性？

✅ 好的例子：行优先遍历（空间局部性强）

❌ 坏的例子：列优先遍历（空间局部性差）

六、局部性与性能优化的关系

七、直观示意图（逻辑图）

八、小结

九、延伸：局部性与现代 CPU 特性

🔹总结一句话

结语