阮一峰的文章
字符串匹配算法:给定两个字符串A和B,问字符串A是否包含字符串B。
KMP算法
最简单的思路如下:
- 就是A字符串固定,然后把B字符串和A字符串对齐,从头到尾进行字符的比较。
- 遇到字符不相同的情况,将B字符串向后错一位。
- 一直比较直到比较完A和B为止。
这种思路是比较耗时的,很多比较都是浪费,所以才有了KMP算法,KMP这三个字母是三个大佬的首字母。KMP的思路如下:
- 构建《部分匹配表》,对于字符串B,每个字符都计算一个部分匹配值。
- 按照“简单思路”的1和2,进行匹配,但是遇到不相同的字符时,并不是将B字符串向后错一位。错位的数量为:
匹配中的字符数 - 匹配中的最后一个字符的部分匹配值
。 - 一直比较直到比较完A和B为止。
KMP的思路就是,每次错位的时候,放弃掉无效的错位,直接把B字符串错位到最有可能进行匹配中的位置。