Linux 序列化与反序列化原理及自定义协议实现

Linux 网络编程中数据以字节流传输，直接传递结构体存在内存对齐、大小端及跨语言适配问题。序列化将结构体转为字符串便于发送，反序列化还原为结构体便于处理。通过封装 Socket 类、设计 TCP 服务端及自定义协议（含报头解决粘包半包），结合 Jsoncpp 库实现网络版计算器，演示了完整的序列化流程与通信机制。

草莓泡芙发布于 2026/2/5更新于 2026/4/187.8K 浏览

文章配图

在 Linux 网络编程和系统开发中，序列化与反序列化几乎是绕不开的话题。无论是进程间通信，还是基于 Socket 的网络传输，数据最终都需要以字节流的形式在系统中流转。而很多初学者在实际开发中，往往只会'用协议'，却并不清楚协议是如何设计的、数据又是如何被序列化和还原的。

今天我们将围绕 Linux 环境下的序列化与反序列化，从基本原理入手，逐步分析自定义协议的设计思路与实现方式，结合实际示例，帮助你真正搞懂数据在网络通信中的完整生命周期。

一、序列化与反序列化

在讲解什么是序列化与反序列化之前，我们先回顾一下之前我们讲解协议时的一些相关知识：

文章配图

比如现在我要通过网络完成一个简单的计算器，即：完成两个数之间的运算，包括：加减乘除等，那么对于客户端和服务端而言，它们就要"约定"好所要传输的结构体中的内容，这其实就是"自定义协议"的体现。

就如上图所示的：两个要运算的数字和运算方式，即'+ - * /'等符号，这样客户端将结构体发给服务端，服务端中也有该结构体类型，通过指针就能提取到客户端发来的数据。

但是这种直接传递结构体的方式会面临许多问题，如：

**1.内存对齐问题。不同的编译器，不同的操作系统可能对于结构体的填充规则不同，既然不一致，那么双方在读取结构体中的数据时就会产生问题，可能就会读成乱码。

2.大小端问题。如果客户端是一个小端机器，服务端是一个大端机器，那么服务端在读取数据时就可能读反客户端所发来的数据。

3.适配性问题。就比如客户端是用 C 语言写的代码，所以传输时直接传递的也就是结构体，但是服务端却是用 java 或者 Python 语言写的，那么因为语言的差异性，服务端就很难完美模拟 C 内存中的物理布局。**

但是操作系统之间确实就是以直接传递结构体的方式进行通信的，并且虽然上面我们列举了很多的问题，但是这些问题都可以被解决，至于具体是通过哪些方式来解决的这里不过多赘述，这不是我们要讲的重点。

当然任何事物都有两面性，这种方式既然有缺点，当然也有优点，这种方式的优点就是：极致的效率，直接传递结构体的这种方式可以使接收方直接把内存地址"看成"结构体，那么 cpu 的占用率就会很低，就几乎不用干活。

那么下面我们就来看看自定义协议的另一种编码方式：序列化与反序列化。

文章配图