zoukankan      html  css  js  c++  java
  • [BZOJ4198]荷马史诗 哈夫曼编码

    4198: [Noi2015]荷马史诗

    Time Limit: 10 Sec  Memory Limit: 512 MB

    Description

    追逐影子的人,自己就是影子。 ——荷马

    Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
    一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
    对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
    现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
    一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
    字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

    Input

    输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。

    接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。

    Output

    输出文件包括 2 行。

    第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
    第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。

    Sample Input

    4 2
    1
    1
    2
    2

    Sample Output

    12
    2

    HINT

    用 X(k) 表示 X 是以 k 进制表示的字符串。
    一种最优方案:令 00(2) 替换第 1 种单词,01(2) 替换第 2 种单词,10(2) 替换第 3 种单词,11(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:
    1×2+1×2+2×2+2×2=12
    最长字符串 si 的长度为 2。
    一种非最优方案:令 000(2) 替换第 1 种单词,001(2) 替换第 2 种单词,01(2) 替换第 3 种单词,1(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:
    1×3+1×3+2×2+2×1=12
    最长字符串 si 的长度为 3。与最优方案相比,文章的长度相同,但是最长字符串的长度更长一些。
    对于所有数据,保证 2≤n≤100000,2≤k≤9。
    选手请注意使用 64 位整数进行输入输出、存储和计算。
     
    题解:
    似乎这道题是纯粹的要求掌握知识点。。。
    如果学过哈夫曼树的话,这就接近一道板子题了。
    我们先来科普下哈夫曼树:
    如果我们设点到根节点的边数×点权为点的带权路径长度,一颗树中每个节点的带权路径长度和为树的带权路径长度,
    给定n个权值作为n个叶子结点,构造一棵二叉树,若树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树。
    也就是说,哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。
    在构造哈夫曼树时,我们只需要取出权值最小的两个点,把他们合并起来,权值和作为新的节点的权值,
    在最后只剩下一个节点时我们就得到了这些节点对应的哈夫曼树。
    哈夫曼树最重要的功能就是前缀编码了!
    我们给每个单词(或者字母)编码的时候,为了使总长度短一些,可以考虑给每个单词/字母不等长编码。
    也就是说,单词中使用频率高的用短码,使用频率低的用长码,从而优化总长度。
    当然,这些编码也不能引起误会,也就是说,不能出现某个串是其他某个串的前缀。
    那么这时候,我们可将每个单词的出现频数作为单词结点的权值赋予该结点上,
    显然单词使用次数越小权值越小,权值越小叶子就越靠下,于是频率小,到根节点距离就长,编码也就长,同理次数大编码短,
    这样就保证了此树的最小带权路径长度效果上就是文章的最短长度。
    我们再看这道题:
    Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
    对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
    现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。
    显然,这里我们就要用哈夫曼树做一个编码即可,但是本题是用k进制编码:
    那么我们只需要把哈夫曼树由二叉树变成k叉树----但是可能节点个数不够。
    我们考虑,一颗满的k叉哈夫曼树,节点数可以表示为n*k*(k-1)+1----也就是说,如果n%((k-1)*k)!=1
    ,我们可以补上几个权值为0的节点,补到n*k*(k-1)+1个,这样他们并不会对我们的建树以及计算产生任何影响(权值为0,计数时也不会计入长度)
    最后我们只要输出整棵树的带权路径长度,以及这棵树中最深的节点深度-1就行了!
    代码见下:
     1 #include <cstdio>
     2 #include <cstring>
     3 #include <queue>
     4 #include <algorithm>
     5 using namespace std;
     6 typedef long long LL;
     7 const int N=100010;
     8 int n,k,maxdeep[N<<7];
     9 LL sum[N<<7],w[N<<7];
    10 struct point
    11 {
    12     int id;
    13     point(int a=0){id=a;}
    14     inline bool operator < (const point &b)const
    15         {return w[id]==w[b.id]?maxdeep[id]<maxdeep[b.id]:w[id]<w[b.id];}
    16     inline bool operator > (const point &b)const
    17         {return w[id]==w[b.id]?maxdeep[id]>maxdeep[b.id]:w[id]>w[b.id];}
    18 };
    19 priority_queue<point, vector<point>, greater<point> >q;
    20 int main()
    21 {
    22     register int i,j;scanf("%d%d",&n,&k);
    23     for(i=1;i<=n;++i)
    24         scanf("%lld",&w[i]),maxdeep[i]=1,q.push(point(i));
    25     j=n%((k-1)*k);
    26     if(k!=2&&j!=1)for(i=1;i<=(1-j+(k-1)*k)%(k-1)*k;++j)
    27         maxdeep[++n]=1,q.push(point(n));
    28     while(q.size()>1)
    29     {
    30         for(++n,i=1;i<=k;++i)
    31             maxdeep[n]=max(maxdeep[n],maxdeep[q.top().id]+1),
    32             sum[n]+=sum[q.top().id]+w[q.top().id],w[n]+=w[q.top().id],q.pop();
    33         q.push(point(n));
    34     }
    35     printf("%lld
    %d",sum[q.top().id],maxdeep[q.top().id]-1);
    36 }
  • 相关阅读:
    CentOS6 图形界面'Basic server'条件下的(gnome)安装 .
    2013年 2月 春节期间 CgyWin 安装总结
    网络爬虫比较
    如何将nutch项目加载到MyEclipse中,生成一个web project
    读过的书
    NBearLite 用MsAccess数据库时 Count() 的错误(BUG?)
    测试Windows Live Writer
    VS2005 编辑器配色
    事务处理
    MVC MvcApplication 中在.CS文件(CodeBehide)中找不到服务器控件的解决办法
  • 原文地址:https://www.cnblogs.com/LadyLex/p/7503173.html
Copyright © 2011-2022 走看看