博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
KMP小结
阅读量:5290 次
发布时间:2019-06-14

本文共 2601 字,大约阅读时间需要 8 分钟。

\(KMP\)是个其实不是很难的算法吧...虽然我表面上学了好久,但其实只有一下午是在学,一下午就完事儿了.
\(KMP\)应该是目前最优秀的单串匹配算法了吧.它的复杂度是\(O(n+m)\).其中,\(n\)为匹配串(即长串)的长度,\(m\)为模式串(即短串)的长度.
看起来确实很猛,我们来康康它是怎么如此优秀地完成工作的.
众所周知,\(KMP\)的核心在于一个\(next\)数组.
我们对它的定义可以是:对于\(1\)\(i\)的字符,前缀等于后缀的最长长度.
最长的前缀等于后缀嘛就是.这东西有啥用?
我们来想一想,如果我们在\(i\)这个位置失配,那么根据定义,我们可以知道如果我们跳到\(next_i\)那么不会使得现在已经匹配的位数变少.
反而可能使得匹配的位数更多,所以我们每次失配的时候要跳向\(next_i\),这一定不会使得情况更劣.
然后我们就这样只要失配就一直跳\(next_i\),可以证明,如果存在一个能匹配的子串,我们一定不会漏掉它.
好了,\(next\)是啥和怎么在匹配中使用说完了,我们考虑怎么样去构造这个\(next\)数组.
如果我直接告诉你让它自己和自己匹配你肯定一脸懵逼.
所以我们考虑这玩意儿的定义:前缀等于后缀的最长长度.
你考虑模式串在自己对自己匹配的时候,实际就是自己的一个前缀在和一个后缀匹配.
而最多能匹配多少位就是我们所需要的\(next\)数组.于是我们得到了怎么构造\(next\)数组.
但是直接暴力匹配还是会导致复杂度退化,怎么办呢?
你想,你的\(next\)是从前向后构造的,也就是说你在构造到第\(i\)位的时候,\(1\)\(i-1\)\(next\)已经构造出来了.
那么我们就可以直接利用之前已经求出来的\(next\)数组去协助我们构造,这样,我们就能达到理想的复杂度.
\(Code:\)

// 这是上面那道模板题的代码.#include 
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#define MEM(x,y) memset ( x , y , sizeof ( x ) )#define rep(i,a,b) for (int i = a ; i <= b ; ++ i)#define per(i,a,b) for (int i = a ; i >= b ; -- i)#define pii pair < int , int >#define X first#define Y second#define rint read
#define int long long#define pb push_backusing std::set ;using std::pair ;using std::max ;using std::min ;using std::priority_queue ;using std::vector ;using std::swap ;using std::sort ;using std::unique ;using std::greater ;template < class T > inline T read () { T x = 0 , f = 1 ; char ch = getchar () ; while ( ch < '0' || ch > '9' ) { if ( ch == '-' ) f = - 1 ; ch = getchar () ; } while ( ch >= '0' && ch <= '9' ) { x = ( x << 3 ) + ( x << 1 ) + ( ch - 48 ) ; ch = getchar () ; } return f * x ;}template < class T > inline void write (T x) { static T stk[100] , top = 0 ; if ( x == 0 ) { putchar ('0') ; return ; } if ( x < 0 ) { x = - x ; putchar ( '-' ) ; } while ( x ) { stk[++top] = x % 10 ; x /= 10 ; } while ( top ) { putchar ( stk[top--] + '0' ) ; } putchar ('\n') ; }const int N = 1e6 + 100 ;char s[N] , t[N] ;int nxt[N] ;signed main (int argc , char * argv[]) { scanf ("%s%s" , s + 1 , t + 1 ) ; int j = 0 ; int n = strlen ( s + 1 ) , m = strlen ( t + 1 ) ; rep ( i , 2 , m ) { while ( j && t[i] != t[j+1] ) j = nxt[j] ; if ( t[i] == t[j+1] ) ++ j ; nxt[i] = j ; } j = 0 ; rep ( i , 1 , n ) { while ( j && s[i] != t[j+1] ) j = nxt[j] ; if ( s[i] == t[j+1] ) ++ j ; if ( j == m ) write ( i - m + 1 ) ; } rep ( i , 1 , m ) printf ("%lld " , nxt[i] ) ; system ("pause") ; return 0 ;}

转载于:https://www.cnblogs.com/Equinox-Flower/p/11488043.html

你可能感兴趣的文章
系统变量和环境变量的区别
查看>>
现代科技高管李刚去向已不再是迷
查看>>
try…catch 结构
查看>>
JavaBean
查看>>
【交题大桥】团队信息存档
查看>>
柯里化
查看>>
【Java】Jackson解析xml的坑
查看>>
javaTest04
查看>>
linux / shell /adb
查看>>
“新智认知”杯上海高校程序设计竞赛暨第十七届上海大学程序设计春季联赛(D题,贪心+栈)...
查看>>
c/c++ 线性栈
查看>>
6月1日PM
查看>>
实验二 网络嗅探实验
查看>>
基于swoole的网页一对一实时聊天
查看>>
环境搭建
查看>>
[UE4]蒙太奇动画运行时不播放,预览是好的
查看>>
源码-0203-Masonry
查看>>
java基础之JDBC六:DBCP 数据库连接池简介
查看>>
Java中关于==与equal和equals的区别
查看>>
Redis常用命令
查看>>