题目大意:
题目链接:https://jzoj.net/senior/#main/show/5462
题目图片:
http://wx4.sinaimg.cn/mw690/0060lm7Tly1fwena030iwj30j70ba74m.jpg
http://wx2.sinaimg.cn/mw690/0060lm7Tly1fwena02ec5j30ja0eb74j.jpg
给出一个长度为的小写字母组成的字符串,求其中有几个不同的(断句)长度为的子串。
思路:
50分做法:
枚举子串开始的位置,再将接下来的位扔进里,记录答案即可。
时间复杂度
代码
100分做法:
字符串。
这道题很诡异的卡单哈希,所以得用双哈希。
我们假设有一个字符串是这样的:
那么我们可以取出它前面的位。
那么如果我们呢要取出这个字符串的第到位,那么应该怎么取呢?
我们假设这个字符串是一个十进制数字。
那么如果我们要取出这个数字串的第到位,那么自然就是:
那么我们可以进一步得到,如果我们要取出这个字符串的第到位,那么就是
所以,如果我们把这个字符串看成一个BASE进制的数字串
,就可以按照上述公式求第到位。
那么就有:
所以,哈希就可以这样用了。
时间复杂度:
代码:
#include <cstdio>
#include <cstring>
#include <map>
#include <iostream>
#define MOD1 290182597
#define MOD2 163227661
#define BASE1 3769
#define BASE2 9439
#define N 200100
#define ll long long
#define mp make_pair
using namespace std;
int n,m,pow1[N],pow2[N],hash1[N],hash2[N],ans;
char c[N];
map<pair<int,int>,int> p;
ll find1(int l,int r)
{
return (hash1[r]-(ll)hash1[l-1]*pow1[r-l+1]%MOD1+MOD1)%MOD1; //上述公式
}
ll find2(int l,int r)
{
return (hash2[r]-(ll)hash2[l-1]*pow2[r-l+1]%MOD2+MOD2)%MOD2;
}
int main()
{
scanf("%d%d",&n,&m);
cin>>c+1;
pow1[0]=1;
pow2[0]=1;
for (int i=1;i<=n;i++)
{
pow1[i]=((ll)pow1[i-1]*BASE1)%MOD1;
pow2[i]=((ll)pow2[i-1]*BASE2)%MOD2; //取出BASE的x次方
hash1[i]=((ll)hash1[i-1]*BASE1%MOD1+c[i]-'a'+1)%MOD1;
hash2[i]=((ll)hash2[i-1]*BASE2%MOD2+c[i]-'a'+1)%MOD2; //HASH函数
}
ll x,y;
for (int i=1;i<=n-m+1;i++)
{
x=find1(i,i+m-1);
y=find2(i,i+m-1);
if (!p[mp(x,y)]) ans++; //没有出现过
p[mp(x,y)]=1;
}
printf("%d\n",ans);
return 0;
}