UCloud 的安全秘钥(困难)
每个 UCloud 用户会构造一个由数字序列组成的秘钥,用于对服务器进行各种操作。作为一家安全可信的云计算平台,秘钥的安全性至关重要。因此,UCloud 每年会对用户的秘钥进行安全性评估,具体的评估方法如下:
首先,定义两个由数字序列组成的秘钥 aa 和 bb 近似匹配(approx≈) 的关系。aa 和 bb 近似匹配当且仅当同时满足以下两个条件:
- |a|=|b|∣a∣=∣b∣,即 aa 串和 bb 串长度相等。
- 对于每种数字 cc,cc 在 aa 中出现的次数等于 cc 在 bb 中出现的次数。
此时,我们就称 aa 和 bb 近似匹配,即 a approx ba≈b。例如,(1,3,1,1,2)approx(2,1,3,1,1)(1,3,1,1,2)≈(2,1,3,1,1)。
UCloud 每年会收集若干不安全秘钥,这些秘钥组成了不安全秘钥集合 TT。对于一个秘钥 ss 和集合 TT 中的秘钥 tt来说,它们的相似值定义为:ss 的所有连续子串中与 tt 近似匹配的个数。相似值越高,说明秘钥 ss 越不安全。对于不安全秘钥集合 TT 中的每个秘钥 tt,你需要输出它和秘钥 ss 的相似值,用来对用户秘钥的安全性进行分析。
输入格式
第一行包含一个正整数 nn,表示 ss 串的长度。
第二行包含 nn 个正整数 s_1,s_2,...,s_n(1leq s_ileq n)s1,s2,...,sn(1≤si≤n),表示 ss 串。
接下来一行包含一个正整数 mm,表示询问的个数。
接下来 mm 个部分:
每个部分第一行包含一个正整数 k(1leq kleq n)k(1≤k≤n),表示每个 tt 串的长度。
每个部分第二行包含 kk 个正整数 t_1,t_2,...,t_k(1leq t_ileq n)t1,t2,...,tk(1≤ti≤n),表示 TT 中的一个串 tt。
输入数据保证 TT 中所有串长度之和不超过 200000200000。
对于简单版本:1leq n,mleq 1001≤n,m≤100;
对于中等版本:1leq nleq 50000,1leq mleq 5001≤n≤50000,1≤m≤500;
对于困难版本:1 le n le 50000, 1 le m le 1000001≤n≤50000,1≤m≤100000。
输出格式
输出 mm 行,每行一个整数,即与 TT 中每个串 tt 近似匹配的 ss 的子串数量。
样例解释
对于第一个询问,(3,2,1,3)approx(2,3,1,3)(3,2,1,3)≈(2,3,1,3),(3,2,1,3)approx(3,1,3,2)(3,2,1,3)≈(3,1,3,2);
对于第二个询问,(1,3)approx(3,1)(1,3)≈(3,1),(1,3)approx(1,3)(1,3)≈(1,3);
对于第三个询问,(3,2)approx(2,3)(3,2)≈(2,3),(3,2)approx(3,2)(3,2)≈(3,2)。
样例输入
5 2 3 1 3 2 3 4 3 2 1 3 2 1 3 2 3 2
样例输出
2 2 2
【分析】给你一个原始数组,数组里每个数都<=n;然后K次询问,每次询问给出一个新的数组,问你原始数组中有多少连续子串是给定数组的
一种重新排列。
对于中等难度的,可以双指针搞一下,但是对于困难的就不会了,看了题解才知道...对于询问给定的数组的总长最大为2000000,而每次给
定的数组最长为50000.也就是说对于一个数组的长度m,不同的m的种数最多才650种。那么我们可以离线,将同种长度的存在一起。然后将
原始的数组的各种长度的m的哈希值算出来,然后排个序,对于此长度的询问的数组就可以根据哈希值二分来统计答案了。那么现在的问题是
怎么哈希...看了题解才知道后还有这种哈希的姿势,给每个数随机一个16位的数,就是ull rand()*rand()...学习到新知识了。
#include <bits/stdc++.h> #define mp make_pair #define pb push_back #define met(a,b) memset(a,b,sizeof a) using namespace std; typedef long long ll; typedef unsigned long long ull; typedef pair<int,int>pii; const int N = 2e5+5; const int mod = 1e9+7; int n,m,k,u; int a[N]; int b[N],ans[N]; ll has[N]; ull sum[N]; vector<pair<ull,int> >vec[N]; vector<int>c; vector<ull>q; int main() { scanf("%d",&n); for(int i=1;i<=n;i++)has[i]=(ull)rand()*rand(); for(int i=1; i<=n; i++){ scanf("%d",&a[i]); sum[i]=sum[i-1]+has[a[i]]; } scanf("%d",&k); for(int i=1;i<=k;i++){ scanf("%d",&m); if(!b[m])c.pb(m),b[m]=1; ull s=0; for(int i=1; i<=m; i++){ scanf("%d",&u); s+=has[u]; } vec[m].pb(mp(s,i)); } for(int x:c){ if(x>n){ for(pair<ull,int> p : vec[x]){ int id = p.second; ans[id]=0; } } else { ull s=0; q.clear(); for(int l=1,r=1;r<=n;r++){ s+=has[a[r]]; if(r-l+1==x){ q.pb(s); s-=has[a[l++]]; } } sort(q.begin(),q.end()); for(pair<ull,int> p : vec[x]){ int id = p.second; ull s = p.first; ans[id]=upper_bound(q.begin(),q.end(),s)-lower_bound(q.begin(),q.end(),s); } } } for(int i=1;i<=k;i++){ printf("%d ",ans[i]); } return 0; }