Levenshtein(通常指 Levenshtein distance,莱文斯坦距离/编辑距离):衡量两个字符串相似度的一种指标,表示把一个字符串变成另一个字符串所需的最少单字符编辑次数(常见操作:插入、删除、替换)。在拼写纠错、模糊搜索、DNA 序列比对等场景中很常用。(也可指姓氏“Levenshtein”。)
The spell checker uses Levenshtein distance to suggest corrections.
拼写检查器使用莱文斯坦距离来给出纠正建议。
By minimizing the Levenshtein distance between user queries and product titles, the search engine improves recall without sacrificing too much precision.
通过最小化用户查询与商品标题之间的莱文斯坦距离,搜索引擎在不过度牺牲准确率的前提下提升了召回率。
/ˈlɛvənʃtaɪn/
/ˈliːvənʃtaɪn/
该词来自俄裔数学家/信息论学者 Vladimir I. Levenshtein(弗拉基米尔·莱文斯坦)的姓氏。后来以他的名字命名了“Levenshtein distance”,用来描述字符串之间的编辑差异。