下面分别介绍:朴素模式匹配算法 和 改进模式匹配算法(KMP)
朴素模式匹配算法思想:
从目标S中的第一个字符开始和模式T中的的第一个比较(用 i 和 j 分别指示S串和T串中正在比较字符的位置),若相等,则继续逐个比较后续字符,否则, 从S 的第二字符重新开始匹配,直到匹配完成。
核心就是 i = i - j +1 ; //其中 j 就是已经匹配字符的个数 。+1 带表下一次匹配的位置。
///朴素匹配 #include<iostream> #include<cstdio> #include<cstring> using namespace std; int Index(char S[],char T[]){ int i,j; i=0;j=0; int lens=strlen(S); int lent=strlen(T); // cout<<lent<<" "<<lens; while(i<lens&&j<lent){ if(S[i]==T[j]){ i++; j++; } else{ i=i-j+1;///然现在T串已经匹配了j 的长度,所以直接将 i 回退 j 个长度 j=0; } } if(j=lent-1)///T 已经匹配结束,然后S 串中的起始位置 return i-lent; else return -1; } int main() { char S[10000]="afdfsdgdfbsderre"; char T[10000]="dgdf"; cout<<Index(S,T)<<endl; return 0; }
改进模式匹配算法(KMP)
时间复杂度O(n + m)
它的改进之处:每一趟匹配过程中出现字符比较不相等时,不需要回溯 i 值 ,而是利用已经的 “ 部分匹配” 的结果将 T(模式)向右 “滑动” 尽可能远的一段距离后在进行比较。 (用通俗的讲: 就是现在不需要将 i 值往会移动, 而是将 T(模式串) 往右移动。具体移动到到哪里就根据next[] 数组的值确定 )
下面介绍如何求解模式串的next 数组值:
根据当位置的前 一个串 的 前缀和后缀串的最多匹配字符个数 //例如当前位置是 j , 就看 0 ~ j-1 这个串的前后缀最多匹配字符数
需要补充的是:0~j-1 这个串的前缀和后缀分别是 1~j-1 和 0~j-2 (意思就是前缀部包括第一个字符, 后最不包括最后一个字符)
求解以前: 自己需要根据题目要求, 设定 next 的起始位置的值, 有的是 0 , 有的则是 以1 ; 具体就看 字符串的起始位置。
下面介绍next 索引 从0 开始
例如: abaabaac
首先 next[0] =0;
求 next[1] 的值得的时候, 我们就看 0~0 显然前缀和后缀串都是空串 所以是 0
next[1] =0;
求 next[2] 的值得的时候, 我们就看 0~1 显然前缀1~1和后缀串 0~0 ; 显然不匹配 所以
next[2]=0;
同理 next[3]=0;
求 next[4] 的值得的时候, 我们就看 0~3 显然前缀1~3和后缀串 0~2 ; 显然t[3]==t[0] =='a'
next[4]=1;
后面的依次类推。
#include<iostream> #include<cstdio> #include<cstring> using namespace std; const int Maxsize =10000; void Get_next(char T[],int(&next)[Maxsize]){///next 的索引从0开始,获取next数组 int i=0,j=-1; next[0]=-1;///初始化 int len =strlen(T); while(i<len){ if(j==-1||T[j]==T[i]){ ++i; ++j; next[i]=j;/// } else j=next[j]; } } void Get_nextval(char T[],int (&nextval)[Maxsize],int next[]){///获取nextval int j=0; nextval[0]=-1;///初始化 int len =strlen(T); for(j=1;j<len;j++){ if(T[next[j]]==T[j]) nextval[j]=nextval[next[j]]; else nextval[j]=next[j]; } } int Index(char S[],int next[],char T[]){///进行模式匹配 int i=0,j=0; int len =strlen(S); int lent =strlen(T); while(i<len&&j<lent){ if((j==-1)||(S[i]==T[j])){ i++; j++; } else j=next[j]; } if(j==lent) return i-lent; else return -1; } int main() { int next[Maxsize]; int nextval[Maxsize]; char S[Maxsize]="afdfsdgdfbsderre"; char T[Maxsize]="bsder"; Get_next(T,next); Get_nextval(T,nextval,next); cout<<Index(S,next,T)<<endl;///通过next数组匹配获取位置信息 cout<<Index(S,nextval,T)<<endl;///通过nextval数组匹配获取位置信息 return 0; }