背景
在字符串处理、自然语言处理(NLP)、搜索引擎、拼写纠错、模糊匹配、DNA 序列分析等领域,编辑距离(Edit Distance) 是一个极其重要的算法。其中最经典、最广泛使用的就是 Levenshtein 距离算法。
Levenshtein 距离由俄罗斯数学家 Vladimir Levenshtein 在 1965 年提出,用于衡量两个字符串之间的相似程度。
什么是编辑距离?
编辑距离表示将字符串 A 转换为字符串 B 所需的最少编辑操作次数。
允许的三种基本操作:
- 插入(Insert)
- 删除(Delete)
- 替换(Replace)

