KMP算法中特征值数组next的计算与使用

搬运自CSDN博客:KMP算法中特征值数组next的计算与使用

在待匹配字符串P中,对于位置i,我们把P(0~i)中最大相同前缀子串和后缀子串的大小成为i的特征值,其组成的数组next[P.length]称为特征值数组。

那么如何求出next数组呢?

next[i-1]表示P(0~i-1) 中最大相同前缀子串和后缀子串的大小,假设next[i-1]=k,就说明P(0~i-1)中前k个字符和后k个字符匹配,再比较P[i]时就应该从位置k+1开始比,即比较P[i]与P[next[i-1]]

如果P[i]等于P[next[i-1]],就表明P(0~i)中前k+1个字符和后k+1个字符匹配,即next[i] = k+1 (也就是next[i-1])

如果P[i]不等于P[next[i-1]],你就知道(i-next[i-1]~i)不能与(0~next[i-1])匹配
但你不知道(i-next[i-1]~i)的后缀子串能不能和(0~next[i-1])的前缀子串匹配
而你又知道(0~next[i-1]-1)能和(i-next[i-1]~i-1)匹配(内容完全相同)。
那么你就可以把s[i]接到位置k上,即直接考察子串(0~k-1)+s[i],就能知道“(i-next[i-1]~i)的后缀子串”与“(0~next[i-1])的前缀子串”这两个子串的匹配情况。

举个例子:


next[7]=4,表明P[0~3]与P[4~7]匹配
而P[8]不等于P[4],则
”abbaa”!=”abbab”
但这两个子串的前四个字符是一样的,也就是P[48]中的P[47]等于P[0~4]中的P[0~3]
但是你不能断定P[4~8]的后缀子串能否与P[0~4]的前缀字串是否匹配,而你又知道P[0~3]==P[4~7],所以你可以把P[8]接到P[0~3]后面来判定。

代码如下:

int * getNext(string s)  
{  
    unsigned int m =s.length();  
    int * Next = newint[m];  
    Next[0] = 0;  
    int k;  
    for(unsigned int i= 1 ; i < m ; i++)  
    {  
        k = Next[i -1];  
        while(k > 0&& s[k] != s[i])  
            k = Next[k- 1];  
        /** 
        **  s[k] != s[i] 
            从k再往后(k~i-1)比就没有意义了 
            但你不知道在k之前(0~k-1)能不能匹配 
            考察范围从i变成k,相当于把s[i]接到k上 
        ** 
        **/  
        if(s[k] ==s[i])  
            Next[i] =k + 1;  
        else  
            Next[i] =0;  
    }  
    return Next;  
}  

那么如何在KMP匹配过程中使用next数组呢?

代码如下:

int getSubString(string target , string pattern , int startIndex = 0)  
{  
    int pl = pattern.length();  
    int tl = target.length();  
    if(tl - pl - startIndex < 0)  
        return -1;  
    int * next = new int[pl];  
    next = getNext(pattern);  
    int j = 0;  //pattern[j]  
    for(int i = startIndex ; i < tl ; i++)   //target[i]  
    {  
        while(j > 0 && pattern[j] != target[i])  
        {  
            j = next[j - 1];  
        }  
        if (pattern[j] == target[i])  
        {  
            j++;  
        }  
        if(j == pl)  
            return i-j+1;  
    }  
    return -1;  
  
}  

等等,j=next[j-1]什么鬼?


为了理解j=next[j-1],我们再举个例子:


目标字符串T:DBCABCEABC CABCABCDE
待匹配字串P:ABCEABCD
T[0],T[1],T[2]都不匹配,直接过。
从T[3]开始一直匹配到T[9]均与P匹配。
然而T[10]与P[7]不匹配(i=10,j=7)
这时我们应该适当调整i和j的位置。
一个比较容易想到的思路就是将T的位置跳到第二个ABC的A上,P跳到第一个字符A
对于i,先跳到匹配P之前的位置:i -= j,再跳到下一个ABC上,也就是i += j – next[j-1]。综上,i = i – next[j-1]。
对于j,直接跳到初始位置,j = 0。
然而如果i,j同时变化会影响代码的简洁度,更重要的是,如果i往回跳的话会影响算法的运行效率。所以我们只要改变j相对于i的位置就可以了。
j相对于i来向后移了:j-next[j-1]。
所以,j-=(j-next[j-i]),即j=next[j-1]

通过对next数组的理解,我们就可以愉快地使用KMP算法啦。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 200,045评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,114评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 147,120评论 0 332
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,902评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,828评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,132评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,590评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,258评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,408评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,335评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,385评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,068评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,660评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,747评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,967评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,406评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,970评论 2 341

推荐阅读更多精彩内容