CCF/CSP-201612-4-压缩编码

zoukankan html css js c++ java

CCF/CSP-201612-4-压缩编码
问题描述

　　给定一段文字，已知单词a₁, a₂, …, a_n出现的频率分别t₁, t₂, …, t_n。可以用01串给这些单词编码，即将每个单词与一个01串对应，使得任何一个单词的编码（对应的01串）不是另一个单词编码的前缀，这种编码称为前缀码。
　　使用前缀码编码一段文字是指将这段文字中的每个单词依次对应到其编码。一段文字经过前缀编码后的长度为：
　　L=a₁的编码长度×t₁+a₂的编码长度×t₂+…+ a_n的编码长度×t_n。
　　定义一个前缀编码为字典序编码，指对于1 ≤ i < n，a_i的编码（对应的01串）的字典序在a_i₊₁编码之前，即a₁, a₂, …, a_n的编码是按字典序升序排列的。
　　例如，文字E A E C D E B C C E C B D B E中， 5个单词A、B、C、D、E出现的频率分别为1, 3, 4, 2, 5，则一种可行的编码方案是A:000, B:001, C:01, D:10, E:11，对应的编码后的01串为1100011011011001010111010011000111，对应的长度L为3×1+3×3+2×4+2×2+2×5=34。
　　在这个例子中，如果使用哈夫曼(Huffman)编码，对应的编码方案是A:000, B:01, C:10, D:001, E:11，虽然最终文字编码后的总长度只有33，但是这个编码不满足字典序编码的性质，比如C的编码的字典序不在D的编码之前。
　　在这个例子中，有些人可能会想的另一个字典序编码是A:000, B:001, C:010, D:011, E:1，编码后的文字长度为35。
　　请找出一个字典序编码，使得文字经过编码后的长度L最小。在输出时，你只需要输出最小的长度L，而不需要输出具体的方案。在上面的例子中，最小的长度L为34。

输入格式

　　输入的第一行包含一个整数n，表示单词的数量。
　　第二行包含n个整数，用空格分隔，分别表示a₁, a₂, …, a_n出现的频率，即t₁, t₂, …, t_n。请注意a₁, a₂, …, a_n具体是什么单词并不影响本题的解，所以没有输入a₁, a₂, …, a_n。

输出格式

　　输出一个整数，表示文字经过编码后的长度L的最小值。

样例输入

5
1 3 4 2 5

样例输出

34

样例说明

　　这个样例就是问题描述中的例子。如果你得到了35，说明你算得有问题，请自行检查自己的算法而不要怀疑是样例输出写错了。

评测用例规模与约定

　　对于30%的评测用例，1 ≤ n ≤ 10，1 ≤ t_i ≤ 20；
　　对于60%的评测用例，1 ≤ n ≤ 100，1 ≤ t_i ≤ 100；
　　对于100%的评测用例，1 ≤ n ≤ 1000，1 ≤ t_i ≤ 10000。

这个题换个说法就是固定合并位置的石子合并问题，然后撸了个区间dp就A了，复杂度是O(N^3)，上了四边形不等式优化。

这是迄今为止最简单的t4了感觉>_<

思路还是仿照哈夫曼树的生成，但是这几个数的顺序是固定的，体现在树中，这几个叶子节点的次序就是输入的次序，然后问题就是从根开始如何分配子树了，枚举每个可能分割的点，直至分割到叶子为止，

写的时候从叶子开始向上递推，贡献也很好算f[l,r]=f[l,k]+f[k+1,r]+SUM{a[i] | l<=i<=r } k为分割点。
1 #include<bits/stdc++.h> 2 using namespace std; 3 #define LL long long 4 #define inf 0x3f3f3f3f 5 int n; 6 int a[1010],pre[1010]; 7 LL f[1010][1010]; 8 int p[1010][1010]; 9 int main() 10 { 11 cin>>n; 12 for(int i=1;i<=n;++i)cin>>a[i],pre[i]=pre[i-1]+a[i],f[i][i]=0,p[i][i]=i; 13 for(int len=2;len<=n;++len){ 14 for(int i=1,j=i+len-1;j<=n;++i,++j){ 15 f[i][j]=5e18; 16 int del=pre[j]-pre[i-1]; 17 for(int k=p[i][j-1];k<=p[i+1][j];++k){ 18 if(f[i][k]+f[k+1][j]+del<f[i][j]){ 19 f[i][j]=f[i][k]+f[k+1][j]+del; 20 p[i][j]=k; 21 } 22 } 23 } 24 }cout<<f[1][n]<<' '; 25 return 0; 26 }
查看全文

相关阅读:
《大数据之路：阿里巴巴大数据实践》——7-章数据挖掘
 《如何做到毫秒级从百亿大表任意维度筛选数据？》
《大数据之路：阿里巴巴大数据实践》——6-章数据服务
 《【原创】推荐系统
 给机器学习面试者的十项建议 | 面试官角度
 干货 | NLP算法岗大厂面试经验与路线图分享
 目标检测任务中的训练宝典｜实用技巧
 食物图片变菜谱：这篇CVPR论文让人人都可以学习新料理
 一文彻底搞懂BP算法：原理推导+数据演示+项目实战（下篇）
CVPR 2019细粒度图像分类竞赛中国团队DeepBlueAI获冠军 | 技术干货分享

原文地址：https://www.cnblogs.com/zzqc/p/12499238.html