Python 判断 str1 是否 str2 子串,为什么不用 KMP 算法呢?

2018-05-10 12:42:12 +08:00
 cheesea

据我所知 python 的 str2 in str1, str1.find(str2)等操作,时间复杂度是 O(MN),那么为什么不用效率更高的 KMP 算法呢?

4562 次点击
所在节点    Python
12 条回复
glasslion
2018-05-10 12:48:20 +08:00
Java 判断 str1 是否 str2 子串,为什么不用 KMP 算法呢
C++ 判断 str1 是否 str2 子串,为什么不用 KMP 算法呢
Javascript 判断 str1 是否 str2 子串,为什么不用 KMP 算法呢
Ruby 判断 str1 是否 str2 子串,为什么不用 KMP 算法呢
Go 判断 str1 是否 str2 子串,为什么不用 KMP 算法呢
PHP 判断 str1 是否 str2 子串,为什么不用 KMP 算法呢
HelloAmadeus
2018-05-10 12:53:23 +08:00
难实现吧,而且也没什么必要,大部分程序的字符串处理都很短的
watzds
2018-05-10 12:58:53 +08:00
字符串不长的情况下,还不一定呢,而且最坏情况才是 mn,一般情况差不多
sticnarf
2018-05-10 12:59:48 +08:00
https://github.com/python/cpython/blob/master/Objects/stringlib/fastsearch.h#L5

介于 Boyer-Moore 和 Horspool 之间的算法,效率比 KMP 要高。

主流 C++标准库里的 find() 的确是朴素的 O(MN) 的算法,但在大部分实际的情况下,最坏的情况极少发生。
roy2220
2018-05-10 13:01:16 +08:00
因为这样做不对
xomix
2018-05-10 13:41:46 +08:00
因为合格的员工不会把千八百甚至上万的这种需求仍旧定义为简单的 find 需求,所以在这种情况下当然是朴素的算法更直接。
josephpei
2018-05-10 14:56:32 +08:00
c++17 里新加了一个函数 boyer_moore_searcher : A searcher suitable for use with the Searcher overload of std::search that implements the Boyer-Moore string searching algorithm
junnplus
2018-05-10 14:58:13 +08:00
首先提问题需要知道是什么,再问为什么,不要一上来就“据我所知”,然后扣高帽子 : )

kmp 在字符串搜索中并不是很高效的算法,另外算法的使用离不开场景...

#4 正解
josephpei
2018-05-10 14:58:47 +08:00
C++17 里还有 boyer_moore_horspool_searcher
cheesea
2018-05-10 18:16:43 +08:00
@junnplus
。。。。。。。。。。。。
shiyouming91
2018-05-11 05:22:19 +08:00
据我所知,kmp 需要先花时间编译被找的字符串,在不知道被找的字符串是否会被重复使用的前提下效率只会更低。
luzhongqiu
2018-05-14 15:35:08 +08:00
被搜索的是常态的话,用 ac 自动机吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/453724

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX