Go 语言实现汉明距离（Hamming Distance）算法详解与源码

背景

在计算机科学、信息论与数据通信领域，**汉明距离（Hamming Distance）**是一个极其重要的概念。它用于衡量两个等长字符串之间的差异程度，定义为：

在对应位置上不同字符的个数。

例如：

"1011101"
"1001001"

不同位置有 2 处，因此汉明距离为 2。

汉明距离最早由美国数学家理查德·汉明（Richard Hamming）提出，并应用于著名的汉明码（Hamming Code）中，用于错误检测与纠正。

在实际工程中，汉明距离广泛应用于：

数据通信中的错误检测

// ============================================= // 文件：main.go // ============================================= package main import ( "errors" "fmt" ) // ============================================= // 方法一：字符串版本（支持 Unicode） // ============================================= // HammingDistanceString 计算两个字符串的汉明距离 // 参数：两个字符串 // 返回：距离值，错误信息 func HammingDistanceString(s1, s2 string) (int, error) { // 转换为 rune 切片，支持 Unicode r1 := []rune(s1) r2 := []rune(s2) // 长度必须相等 if len(r1) != len(r2) { return 0, errors.New("两个字符串长度必须相等") } distance := 0 // 逐字符比较 for i := 0; i < len(r1); i++ { if r1[i] != r2[i] { distance++ } } return distance, nil } // ============================================= // 方法二：整数版本（普通统计法） // ============================================= // HammingDistanceInt 普通位统计版本 func HammingDistanceInt(x, y int) int { // 异或运算 n := x ^ y count := 0 // 统计二进制中 1 的个数 for n > 0 { if n&1 == 1 { count++ } n >>= 1 } return count } // ============================================= // 方法三：整数版本（优化 Brian Kernighan） // ============================================= // HammingDistanceOptimized 优化版本 func HammingDistanceOptimized(x, y int) int { n := x ^ y count := 0 // 每次消除一个 1 for n != 0 { n = n & (n - 1) count++ } return count } // ============================================= // 主函数测试 // ============================================= func main() { fmt.Println("====== 字符串版本测试 ======") d1, err := HammingDistanceString("karolin", "kathrin") if err != nil { fmt.Println("错误：", err) } else { fmt.Println("汉明距离：", d1) } d2, err := HammingDistanceString("1011101", "1001001") if err != nil { fmt.Println("错误：", err) } else { fmt.Println("汉明距离：", d2) } fmt.Println("\n====== 整数版本测试 ======") x := 1 y := 4 fmt.Println("普通版本汉明距离：", HammingDistanceInt(x, y)) fmt.Println("优化版本汉明距离：", HammingDistanceOptimized(x, y)) }

Go 语言实现汉明距离（Hamming Distance）算法详解与源码

背景

需求

基础功能需求

增强功能需求

代码规范要求

扩展需求

技术原理

什么是汉明距离？

字符串版本 vs 整数版本

字符串版本

整数版本

Brian Kernighan 算法

Go 语言相关知识点

实现思路

第一种：字符串汉明距离

第二种：整数版本（普通位统计）

第三种：优化整数版本（Brian Kernighan）

代码实现

代码解读

1. HammingDistanceString

2. HammingDistanceInt

3. HammingDistanceOptimized

总结

常见问题

Q1：为什么字符串长度必须相等？

Q2：整数版本为什么使用异或？

Q3：优化算法为什么更快？

Q4：可以用于大整数吗？

扩展方向

1. 使用 math/big 实现大整数汉明距离

2. GPU 并行优化

3. 应用于感知哈希（pHash）

4. 批量计算优化

更多推荐文章

相关免费在线工具

Go 语言实现汉明距离（Hamming Distance）算法详解与源码

背景

需求

基础功能需求

增强功能需求

代码规范要求

扩展需求

技术原理

什么是汉明距离？

字符串版本 vs 整数版本

字符串版本

整数版本

Brian Kernighan 算法

Go 语言相关知识点

实现思路

第一种：字符串汉明距离

第二种：整数版本（普通位统计）

第三种：优化整数版本（Brian Kernighan）

代码实现

代码解读

1. HammingDistanceString

2. HammingDistanceInt

3. HammingDistanceOptimized

总结

常见问题

Q1：为什么字符串长度必须相等？

Q2：整数版本为什么使用异或？

Q3：优化算法为什么更快？

Q4：可以用于大整数吗？

扩展方向

1. 使用 math/big 实现大整数汉明距离

2. GPU 并行优化

3. 应用于感知哈希（pHash）

4. 批量计算优化

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具