Linux 网络编程：使用 C++ 实现 JSON 与 HTTP Web 服务器

JSON 序列化原理及 nlohmann/json 库的使用，详解 HTTP 协议结构（请求/响应报文、状态码、方法），并基于 C++ Socket 编程与线程池实现了一个支持静态资源与计算功能的 Web 服务器。内容涵盖网络通信、协议解析、文件 IO 及业务逻辑，适合 Linux 网络编程学习者。

宁静发布于 2026/4/6更新于 2026/4/179 浏览

本文前置知识

序列化与反序列化

引入

在之前的博客中，我详细介绍了序列化 与反序列化 的概念。对于使用 TCP 协议进行通信的双方，由于 TCP 是面向字节流的，在发送数据之前，我们通常需要定义一种结构化的数据来描述传输内容，并以此作为数据的容器。在 C++ 中，这种结构化数据通常表现为对象或结构体。然而，我们不能直接将结构体内存中对应的字节原样发送到另一端，因为直接传递内存字节会引发字节序 和结构体内存对齐 的问题。不同平台、不同编译器所遵循的内存对齐规则可能不同，这可能导致接收方在解析结构体字段时出现错误。

因此，我们需要借助序列化 。序列化 是指将结构化的数据按照预定的规则转换为连续的字节流。其主要目的是屏蔽平台差异，使得位于不同平台的进程能够以统一的方式解析该字节流。序列化通常分为两种形式：文本序列化 与二进制序列化 。

文本序列化将结构化的数据转换为一个完整的字符串。字符串本身是以字符为单位的连续序列，每个字符通常占用一个字节，因此字符串本质上也是一个连续的字节流。由于字符串以字符为单位解析，不存在字节序问题。通信双方只需约定字符串的格式与编码方式，即可正确解析该字符序列，最终将连续的字节流还原为结构化的数据。

二进制序列化则直接发送数据在内存中的原始二进制序列，无需额外转换。这两种方式各有优劣：文本序列化直观、可读性高、便于调试；而二进制序列化发送的是二进制数据，人类难以直接阅读。文本序列化会将数据转换为字符形式，可能导致传输体积增大——例如整数 100000 在文本序列化中会被转换为 "100000" 占 6 个字节，而作为 int 类型的二进制序列化仅需 4 个字节。因此，二进制序列化在传输体积上通常更小。此外，文本序列化还需要对字符串进行解析以恢复原始数据，而二进制序列化的解析开销通常更低，因为它直接对应数据的原始二进制表示。

特性	文本序列化 (JSON/XML)	二进制序列化 (Protobuf/Thrift)
可读性	极高（肉眼可读）	低（十六进制乱码）
传输体积	较大（数字变字符，带大量引号）	极小（紧凑编码）
解析速度	较慢（需字符串扫描、词法解析）	极快（直接偏移寻址或位运算）
跨语言	完美（天然支持）	优秀（需编译 IDL 文件）

在上一篇博客中，我们手动实现了文本序列化，即将结构体各字段按一定格式拼接为完整字符串。我之所以手动实现，是为了帮助大家理解序列化的基本原理，并为本文内容做铺垫。

然而在实际开发中，我们通常不需要从头实现序列化，可以使用成熟的第三方库来完成这项工作。这些库的实现通常更完善、更高效。本文将介绍的第一个主题——JSON ，就是一种广泛应用的文本序列化格式。

`JSON`

首先，介绍一下什么是 JSON 。JSON （JavaScript Object Notation）是一种轻量级、基于文本、人类可读的数据交换格式。JSON 源于 JavaScript，借鉴了其对象和数组的表示方法。但由于 JSON 本身是文本格式，且所表示的基本数据类型（如整型、布尔值等）在绝大多数编程语言中都得到支持，因此JSON 并不局限于 JavaScript，而是能够被多种编程语言解析与生成。正因如此，JSON 不仅具备跨平台 能力，还能实现跨语言 的数据交换。

了解 JSON 的基本定义后，我们进一步探讨其本质。如上所述，JSON 实质上是一种文本序列化的方式。在此之前，我们曾手动实现过文本序列化，其核心原理是将结构体的各个字段按照特定格式拼接为一个完整的字符串。因此，JSON 的本质其实就是符合 JSON 规范（风格）的字符串。

理论上，只要我们清楚 JSON 格式的规范，就可以利用字符串操作函数手动拼接出符合 JSON 风格的字符串，而无需借助第三方库。字符串拼接本身并不复杂，因此自然引出一个疑问：相比手动实现，第三方库的优势究竟在哪里？如果仅实现序列化（即转换为 JSON 字符串），那么使用第三方库似乎并未显著减轻负担，因为序列化这一步本身并不困难。要回答这个问题，我们首先需要明确 JSON 风格字符串的具体形式，进而理解第三方库所承担的工作。这一点我们稍后再展开。

JSON 类型	C++ 对应类型	描述
Number	`int`, `double`, `float`	JSON 不区分整数和浮点数，统一视为数字。
Boolean	`bool`	只有 `true` 和 `false` 两个字面值。
String	`std::string`	必须使用双引号包围，支持转义字符（如 `\n`, `\t`）。
Null	`nullptr` / `NULL`	表示空值或不存在，常用于可选字段。

码点范围 (十六进制)	字节数	字节模板 (二进制)
`0000 0000` - `0000 007F`	1	`0xxxxxxx` (完全兼容 ASCII)
`0000 0080` - `0000 07FF`	2	`110xxxxx 10xxxxxx`
`0000 0800` - `0000 FFFF`	3	`1110xxxx 10xxxxxx 10xxxxxx` (大部分汉字在这)
`0001 0000` - `0010 FFFF`	4	`11110xxx 10xxxxxx 10xxxxxx 10xxxxxx`

组成部分	示例内容	专业术语
协议	`https://`	Scheme
域名	`www.example.com`	Domain/Host
端口	`:443`	Port
路径	`/music/list`	Path
参数	`?id=1024&type=pop`	Query String
锚点	`#comment`	Fragment

域名后缀	代表含义	适用对象
.com	Commercial	最初限企业，现已演变成全球通用的商业标识。
.org	Organization	各种非营利性机构、开源项目。
.net	Network	最初为网络基础设施（ISP）设计。
.edu	Education	主要是美国高等教育，中国则对应二级域名 `.edu.cn`。
.gov	Government	仅限政府机构使用，具有极高权威性。

请求方法	语义 (Action)	数据位置	是否有 Body	幂等性*	安全性**	典型应用场景
GET	获取资源	URL 查询参数	否	是	是	浏览网页、搜索图片、查询余额
POST	新增或处理资源	请求体 (Body)	是	否	否	注册账号、发表评论、上传文件
PUT	更新（全量覆盖）	请求体 (Body)	是	是	否	修改用户完整档案、上传同名覆盖文件
PATCH	更新（局部修改）	请求体 (Body)	是	否	否	只修改用户的头像或改个密码
DELETE	删除资源	URL 路径	否	是	否	注销账户、删除一条朋友圈
HEAD	获取头部信息	N/A	否	是	是	检查链接有效性、获取文件大小
OPTIONS	查询支持的方法	N/A	否	是	是	跨域 (CORS) 前询问服务器允许哪些操作
TRACE	回显服务器收到的请求	N/A	否	是	是	用于诊断或测试网络路径中的代理

Linux 网络编程：使用 C++ 实现 JSON 与 HTTP Web 服务器

本文前置知识

序列化与反序列化

引入

`JSON`

更多推荐文章

相关免费在线工具

原理

补充

`HTTP`

引入

原理

`域名`

`HTTP 协议`

`GET 请求`

Linux 网络编程：使用 C++ 实现 JSON 与 HTTP Web 服务器

本文前置知识

序列化与反序列化

引入

JSON

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

原理

补充

HTTP

引入

原理

域名

HTTP 协议

GET 请求

`JSON`

`HTTP`

`域名`

`HTTP 协议`

`GET 请求`