zoukankan      html  css  js  c++  java
  • bzoj4198 荷马史诗

    Description

    追逐影子的人,自己就是影子。 ——荷马

    Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
    一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
    对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
    现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
    一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
    字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

    Input

    输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。

    接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。

    Output

    输出文件包括 2 行。

    第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
    第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。
     

    类似哈夫曼树的构造方式,贪心选择时若两个节点大小相同则选子树深度小的

    #include<cstdio>
    #include<queue>
    typedef long long lint;
    struct node{
        int h;
        lint vs;
        node(int a,lint b):h(a),vs(b){}
    };
    inline bool operator<(node a,node b){
        if(a.vs!=b.vs)return a.vs>b.vs;
        return a.h>b.h;
    }
    std::priority_queue<node>q;
    int n,k;
    lint c,v(0);
    int main(){
        scanf("%d%d",&n,&k);
        for(int i=1;i<=n;i++){
            scanf("%lld",&c);
            q.push(node(0,c));
        }
        while((n-1)%(k-1)){
            q.push(node(0,0));
            n++;
        }
        while(n>1){
            int h=0;
            lint vs=0;
            for(int i=0;i<k;i++){
                node w=q.top();q.pop();
                vs+=w.vs;
                if(w.h>h)h=w.h;
            }
            v+=vs;
            q.push(node(h+1,vs));
            n-=k-1;
        }
        printf("%lld
    %d
    ",v,q.top().h);
        return 0;
    }
  • 相关阅读:
    特征词选择算法对文本分类准确率的影响(前言)
    答火星人.NET。如何使用我的本科毕业程序 正文提取DEMO
    有关matlab画图格式的部分代码
    文本分类中的特征词选择算法系列科普(前言AND 一)
    c++杂项备忘
    写一点应用关于 Lucene.Net,snowball的重新组装(一)在Lucene.Net中加入词性标注与词根还原功能
    C++字符串处理:批量去重,以及大写变小写
    Python打印到文件
    中文分词:采用二元词图以及viterbi算法(三)
    博客园和百度空间,我的两个家
  • 原文地址:https://www.cnblogs.com/ccz181078/p/5209620.html
Copyright © 2011-2022 走看看