色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

KMP算法詳解

冬至子 ? 來源:數據結構和算法 ? 作者:博哥 ? 2023-06-07 16:23 ? 次閱讀

KMP 算法主要用于字符串匹配的,他的時間復雜度 O(m+n) 。常規的字符串匹配我們一般都這樣做,使用兩個指針,一個指向主串,一個指向模式串,如果他倆指向的字符一樣,他倆同時往右移一步,如果他倆指向的字符不一樣,模式串的指針重新指向他的第一個字符,主串的指針指向他上次開始匹配的下一個字符,如下圖所示。

圖片

我們看到當模式串和主串匹配失敗的時候,模式串會從頭開始重新匹配,主串也會回退,但我們知道失敗字符之前的子串都是匹配成功的,那么這個信息能不能被我們利用呢?當然可以,這個就是我們這里要講的 KMP 算法,他就是利用匹配失敗后的信息,盡量減少模式串與主串的匹配次數以達到快速匹配的目的。

當使用 KMP 算法的時候,如果某個字符匹配失敗,主串指針不回退,而模式串指針不一定回到他的第一個字符,如下圖所示。

圖片

當字符 ed 匹配失敗之后,主串指針不回退,模式串指針指向字符 c ,然后在繼續判斷。主串指針不回退好操作,但模式串指針怎么確定是回到字符 c ,而不是其他位置呢?這是因為在字符 e 匹配失敗后,字符 e 前面有 2 個字符 ab 和最開始的 2 個字符 ab 相同,所以我們可以跳過前 2 個字符。也就是說模式串匹配某一個字符失敗的時候,如果這個失敗的字符前面有 m 個字符和最開始的 m 個字符相同,那么下次比較的時候就可以跳過模式串的前 m 個字符,如下圖所示。

圖片

通過上面的圖我們可以知道,當某個字符匹配失敗的時候,他前面的肯定都是成功的,也就是說字符串 s1 和字符串 s2 完全一樣。在模式串中,匹配失敗的字符前面 b4b3 是相同的,所以我們可以得到 b1,b2,b3,b4 都是相同的,也就是說b2b3 也是相同的,既然是相同的,跳過即可,不需要在比較了,直接從他們的下一個字符開始匹配。

KMP 算法的核心部分就是找出模式串中每個字符前面到底有多少字符和最開始的字符相同,我們用 next 數組表示。有的描述成真前綴和真后綴的相同的數量。這里要注意當前字符前面的字符不包含第 1 個字符,最開始的字符也不能包含當前字符,比如在模式串 abc 中不能說字符 c 前面有 ab 和最開始的 ab 相同,來看下表。

1.jpg

我們看到字符 e 前面有 ab 和最開始的字符 ab 相同,長度是 2 。在看第 2a 前面沒有(不包含自己)和最開始字符有相同的,所以是 0 。在任何模式串的第 2 個字符前面都沒有和最開始字符有相同的,因為前面的是不包含第一個字符,所以 next[1]=0 。如果第 2 個沒有,那么第 1 個就更沒有了,為了區分,可以讓 next[0]=-1 ,當然等于 0 也可以,需要特殊處理下即可。我們先來看下 next 數組怎么求。

圖片

使用兩個指針 ij ,其中 j 是字符 p[i] 前面與最開始字符相同的數量,也是 next[i] 。如果 p[j]==p[i],也就是說字符 p[i+1] 前面有 j+1 個字符和最開始的 j+1 個字符相同,所以可以得到 next[i+1]=j+1 ,這個很容易理解。如果 p[j]!=p[i],我們讓指針 j 等于 next[j] ,然后重新和 p[i] 比較,這就是回退,這個回退也是 KMP 算法的最核心部分,我們來分析下為什么要這樣回退。

圖片

如上圖所示,如果 nxet[j] 大于 0 ,那么 j 前面的 b2b1 是相同的,我們知道 S1S2 也是相同的,所以我們可以得出 b1,b2,b3,b4 都是相同的,如果 p[i]!=p[j] ,只需要讓 j 回退到 next[j] ,然后 ij 在重新比較,這個 next[j] 就是 b1 的長度,因為 b1b4 是相同的,所以不需要再比較了。如果還不相同, j 繼續回退,直到回退到 -1 為止,我們拿個真實的字符串看下,如下圖所示。

圖片

我們看到 b1,b2,b3,b4 是相同的,他們都是字符串 "abc" ,如果 p[i]!=p[j] ,我們就讓 j 回退到 next[j] ,因為他們前面 b1b4 是相同的,沒必須要在比較了,最后再來看下代碼。

public int strStr(String s, String p) {
    int i = 0;// 主串S的下標。
    int j = 0;// 模式串P的下標。
    int[] next = new int[p.length()];
    getNext(p, next);// 計算next數組。
    while (i < s.length() && j < p.length()) {
        // 如果j為-1或者p[i]==p[j],i和j都往后移一步。當j為-1時,
        // 說明p[i]!=p[0],然后i往后移一步,j也往后移一步指向p[0]。
        if (j == -1 || s.charAt(i) == p.charAt(j)) {
            i++;
            j++;
            if (j == p.length())// 匹配成功。
                return i - j;
        } else {
            // 匹配失敗,j回退,跳過模式串P前面相同的字符繼續比較。
            j = next[j];
        }
    }
    return -1;
}

private void getNext(String p, int next[]) {
    int length = p.length();
    int i = 0;
    int j = -1;
    next[0] = -1;// 默認值。
    // 最后一個字符不需要比較。
    while (i < length - 1) {
        // 如果j為-1或者p[i]==p[j],i和j都往后移一步。
        if (j == -1 || p.charAt(i) == p.charAt(j)) {
            i++;
            j++;
            // j是字符p[i]前面和最開始字符相同的數量。
            next[i] = j;
        } else {
            j = next[j];// 回退,KMP的核心代碼。
        }
    }
}

KMP優化

我們來看下表 ,當模式串在下標為 4 的位置匹配失敗的時候,下一步 j 會回退到下標為 1 的位置,但這兩個位置的字符是一樣的,既然一樣,拿過來比較也是不會成功,所以如果字符一樣,我們可以優化一下,往前查找相同的子串。

1.jpg

來看下代碼:

private void getNext(String p, int next[]) {
    int length = p.length();
    int i = 0;
    int j = -1;
    next[0] = -1;// 默認值。
    // 最后一個字符不需要比較。
    while (i < length - 1) {
        // 如果j為-1或者p[i]==p[j],i和j都往后移一步。
        if (j == -1 || p.charAt(i) == p.charAt(j)) {
            i++;
            j++;
            // 這里要注意,i和j都已經執行了自增操作。
            if (p.charAt(i) == p.charAt(j))
                next[i] = next[j];
            else
                next[i] = j;
        } else {
            j = next[j];// 回退,KMP的核心代碼。
        }
    }
}

如果前面查找的還是相同的,我們該怎么辦呢?是不是需要寫個遞歸,繼續往前找?實際上是不需要的,比如模式串 "aaaaaaaaaab" ,如果沒優化他是這樣的。

圖片

如果優化之后,當最后一個 a 匹配不成功的時候,他會回退到前面一個 a ,實際上前一個 a 在計算的時候已經回退過了,就是 -1 ,所以不需要遞歸,直接賦值就行。

圖片

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • kmp算法
    +關注

    關注

    0

    文章

    4

    瀏覽量

    1447
收藏 人收藏

    評論

    相關推薦

    昂寶OB3392KMP 資料

    昂寶OB3392KMP 資料隔離 單級PFC10--30瓦
    發表于 11-17 16:49

    SVPWM的原理推導和控制算法詳解

    SVPWM的原理推導和控制算法詳解,不錯的資料,值得一看
    發表于 01-28 15:09

    詳解快速傅里葉變換FFT算法

    本帖最后由 richthoffen 于 2019-7-19 16:41 編輯 詳解快速傅里葉變換FFT算法
    發表于 07-18 08:07

    詳解快速傅里葉變換FFT算法

    詳解快速傅里葉變換FFT算法
    發表于 03-28 11:48

    算法篇(PID詳解)

    算法篇(PID詳解)
    發表于 05-19 10:30

    詳解快速傅里葉變換FFT算法

    詳解快速傅里葉變換FFT算法
    發表于 05-25 09:31

    詳解快速傅里葉變換FFT算法

    詳解快速傅里葉變換FFT算法
    發表于 03-05 11:07

    模式匹配算法的深入研究

    模式匹配算法的深入研究:模式匹配算法的應用較為廣泛, KMP算法是一種性能較高的算法,所以對KMP
    發表于 10-25 12:21 ?13次下載

    路由算法詳解

    路由算法詳解1. 引言 2. 路由器基礎知識 3. LS算法 4. 示例:Dijkstra算法 5. DV算法 6. 分級路由
    發表于 08-06 09:36 ?5511次閱讀
    路由<b class='flag-5'>算法</b><b class='flag-5'>詳解</b>

    SVPWM的原理及法則推導和控制算法詳解

    SVPWM的原理及法則推導和控制算法詳解
    發表于 04-13 15:42 ?18次下載

    SVPWM的原理及法則推導和控制算法詳解

    空間矢量控制原理及法則推導和控制算法詳解
    發表于 05-09 10:59 ?1次下載

    PID算法詳解

    PID算法詳解
    發表于 12-17 20:48 ?12次下載

    基于KMP算法的串口通訊協議解析鄒鐵

    基于KMP算法的串口通訊協議解析_鄒鐵
    發表于 03-17 08:00 ?2次下載

    字符串的KMP算法和BM算法

    本文主要介紹KMP算法和BM算法,它們分別是前綴匹配和后綴匹配的經典算法。所謂前綴匹配是指:模式串和母串的比較從左到右,模式串的移動也是從左到右;所謂后綴匹配是指:模式串和母串的的比較
    發表于 11-15 14:53 ?2432次閱讀
    字符串的<b class='flag-5'>KMP</b><b class='flag-5'>算法</b>和BM<b class='flag-5'>算法</b>

    [源代碼]Python算法詳解

    [源代碼]Python算法詳解[源代碼]Python算法詳解
    發表于 06-06 17:50 ?0次下載
    主站蜘蛛池模板: 亚洲九九视频| a圾片目录大全| 婷婷久久无码欧美人妻| 向日葵视频app下载18岁以下勿看| 亚洲国产果果在线播放在线| 中文在线无码高潮潮喷在线| 91热久久免费频精品99欧美| 亚洲中文热码在线视频| 国产精品久久久精品日日| 三级网站视频在线观看| YELLOW视频在线观看最新| 青青视频 在线 在线播放| Y8848高清私人影院软件优势| 麻豆精品2021最新| 91女神娇喘| 国产色婷婷亚洲99精品 | 乳液全集电影在线观看 | 国产伦精品一区二区三区免费观看| 熟女理发厅| 国产中文在线观看| 亚洲人成电影网站在线观看| 黄色网址在线看| 亚洲日韩KKK444KKK聚色| 久久精品视在线观看2| 中文字幕亚洲第一页| 女人高潮了拔出来了她什么感觉| jizz老太婆| 偷窥 亚洲 色 国产 日韩| 国产揄拍国产精品| 真实国产熟睡乱子伦对白无套 | 国产精品人妻99一区二| 久久久精品久久久久久| 国产成人自拍视频在线观看| 动漫美女3d被爆漫画| 草莓视频cm.888tw| 秋霞电影院兔费理论观频84mb| 中国毛片网| 区一区二视频免费观看| 国产精品99久久久精品无码| 亚洲熟女乱色一区二区三区| 欧美成人性色生活18黑人|