zoukankan      html  css  js  c++  java
  • bzoj3555 [Ctsc2014]企鹅QQ

    Description

    PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
    小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。
    小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的 个账户名称中,有多少对是相似的。
    为了简化你的工作,小Q给你的 个字符串长度均等于 ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。

    Input

    第一行包含三个正整数 , , 。其中 表示账户名称数量, 表示账户名称长度, 用来表示字符集规模大小,它的值只可能为2或64。
    若 等于2,账户名称中只包含字符‘0’和‘1’共2种字符;
    若 等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。
    随后 行,每行一个长度为 的字符串,用来描述一个账户名称。数据保证 个字符串是两两不同的。

    Output

    仅一行一个正整数,表示共有多少对相似的账户名称。

    Sample Input
    4 3 64
    Fax
    fax
    max
    mac

    Sample Output
    4

    分析:第一次做字符串hash
    字符串hash本质就是把字符串转化成一个N进制数
    需要注意的是:
    1.进制的选择:尽量不要是偶数(选择27,233等)
    2.模数的选择:
    (1)选择一个1e6级别的质数,然而错误率高
    (2)选择两个1e6级别的质数双hash,错误率大大降低,然而时间复杂度升高
    (3)选择1e18级别的质数,这种质数本身就不好找,一些特殊情况下会被卡
    (4)开unsigned long long,在乘爆了之后会自动mod 2^64,然而这种情况会被特殊构造的数据卡掉,并且此时的进制一定不能是偶数

    这道题算是字符串hash的入门题,并不卡ull,代码简单
    枚举不同的位置,计算出每个字符串的hash值,
    logn排序,hash值相同的字符串可以有n*(n-1)/2的贡献

    我这里选取的进制是233
    所以计算hash值得时候可以不用特殊处理(总共才有128个字符)
    当然也可以特殊处理成紧凑的64位(费时)

    void ha(int bh)
    {
        ll tt=0;
        for (int i=0;i<l;i++)
        {
            if (w[i]>='a'&&w[i]<='z')
               tt=tt*d+(ll)(w[i]-'a'+1);  //0不能有数 
            else if (w[i]>='A'&&w[i]<='Z')
               tt=tt*d+(ll)(w[i]-'A'+27);
            else if (w[i]>='0'&&w[i]<='9')
               tt=tt*d+(ll)(w[i]-'0'+53);
            else if (w[i]=='_') 
               tt=tt*d+63;
            else
               tt=tt*d+64;
            h[bh][i]=tt;  //1~i的hash 
        }
    }

    这道题唯一的小难点在于如何获得扣去一位的hash值
    我们先预处理出每个字符串1~i位的hash值

    这里写图片描述

    这里写代码片
    #include<cstdio>
    #include<cstring>
    #include<iostream>
    #include<algorithm>
    #define ll unsigned long long  //这道题不卡ull 
    
    using namespace std;
    
    const int N=30001;
    int n,l,S;
    char w[501],c;
    ll h[N][201],a[N],ans=0,d=233;
    ll dd[N]; 
    
    void cl()  
    {
        int i; dd[0]=1;
        for (i=1;i<=200;i++) dd[i]=dd[i-1]*d;  //爆ll之后自动%2^64 
    }
    
    void ha(int bh)
    {
        ll tt=0;
        h[bh][0]=w[0];
        for (int i=1;i<l;i++)
            h[bh][i]=h[bh][i-1]*d+w[i];   
    }
    
    int main()
    {
        cl();
        scanf("%d%d%d",&n,&l,&S);
        scanf("%c",&c);
        for (int i=1;i<=n;i++)
        {
            scanf("%s",&w);
            ha(i);
        }
        for (int i=0;i<l;i++) //枚举不同位 
        {
            for (int j=1;j<=n;j++)
                 a[j]=h[j][l-1]-dd[l-i-1]*h[j][i]+dd[l-1-i]*h[j][i-1];
            sort(a+1,a+1+n);
            ll tt=0,t=a[1];
            int k=1;
            while (k<=n)
            {
                if (a[k]==t) tt++,k++;
                if (a[k]!=t)
                   ans=ans+tt*(tt-1)/2,t=a[k],tt=0;
            }
        }
        printf("%lld",ans);
        return 0;
    }
  • 相关阅读:
    Git windows换行问题
    java之aop使用及自定义注解
    Shiro授权及注解式开发
    Git Gui、Ssh key的使用和ideaui配置使用Git解决冲突(下)
    Git和Github的介绍、简单操作、冲突(上)
    Shiro身份认证、盐加密
    Shiro简介、入门案例、web容器的集成
    SpringMVC入门
    Mybatis之关联关系(一对多、多对多)
    Mybatis整合(Redis、Ehcache)实现二级缓存
  • 原文地址:https://www.cnblogs.com/wutongtong3117/p/7673512.html
Copyright © 2011-2022 走看看