第二次作业 - 走看看

zoukankan html css js c++ java

第二次作业

一、参考书《数据压缩导论（第4版）》 Page 66

2.利用程序huff_enc和huff_dec进行以下操作（在每种情况下，利用由被压缩图像生成的码本）。

(a)对Sena,Sensin和Omaha图像进行编码。

文件名源文件大小（kb）压缩后大小（kb）压缩比

Sena 64　　 57 89.06%

OMAHA 64 58 90.63%

SINAN 64 61 95.31%

4.一个信源从符号集A={a1,a2,a3,a4,a5}中选择字母，概率为P(a1)=0.15,P(a2)=0.04,P(a3)=0.26,P(a4)=0.05,P(a5)=0.50

(a)计算这个信源的熵。（b）求这个信源的霍夫曼码。（c）求（b）中代码的平均长度及其冗余度。

解：

(a). H=0.15*0.41+0.04*0.186+0.26*0.505+0.05*0.216+0.50*0.5=1.82(bits)

(b). 霍夫曼码如下表所示：

符号编码

a1 000

a2 0011

a3 01

a4 0010

a5 1

(c).

平均长度L=3*0.15+4*0.04+2*0.26+4*0.05+1*0.5=1.83(bits/symbol)

所以冗余度=L-H=0.01

5.一个符号集A={a1,a2,a3,a4}，其概率为P(a1)=0.1,P(a2)=0.3,P(a3)=0.25,P(a4)=0.35，使用以下过程找出一种霍夫曼码：

(a)本章概述的第一种过程；

(b)最小方差过程。解释这两种霍夫曼码的区别。

解：

(a).

<1>：写出所有符号的概率；对所有符号按其概率从小到大排序；

<2>：在最小的的码字前加‘0’，在第二小的码字前加‘1’；

<3>：对划分得到的两个子集递归编码，直到每个集合不能被再划分；

得下表：

符号编码

a1 000

a2 01

a3 001

a4 1

(b).

同(a)的算法，只是选择方差小的进行编码，所以编码为：

符号编码

a1 00

a2 01

a3 10

a4 11

平均码长：L=2*0.1+2*0.3+2*0.25+2*0.35=2

由第一种过程方差得S²=0.1(3-2)²+0.3(2-2)²+0.25(3-2)²+0.35(1-2)² =0.70

由第二种过程方差得：S²=0.1(2-2)²+0.3(2-2)²+0.25(2-2)²+0.35(2-2)²=0

所以，最小方差树是第二种。

二、参考书《数据压缩导论（第4版）》Page 30

6.在本书配套的数据中有几个图像和语音文件。

(a) 编写一段程序，计算其中一些图像和语音文件的一阶熵。

(b) 选择一个图像文件，计算其二阶熵。试解释一阶熵与二阶熵的差别。

(c) 对于(b)中所有的图像文件，计算其相邻像素之差的熵，试解释你的发现。

解：

(a).

图像文件的一阶熵：

EARTH.IMG是4.770801

OMAHA.IMG是6.942426

SENA.IMG是6.834299

SENSIN.IMG是7.317944

音频文件的一阶熵：

GABE.RAW是7.116338

BERK.RAW是7.151537

(b).

音频文件BERK.RAW的二阶熵是6.705169

结合(a)发现，一阶熵和二阶熵的差别二阶熵明显比一阶熵小很多。

(c).

音频文件 BERK.RAW的差熵是8.978236

从结果中可以看出，音频文件的差分熵比一阶熵和二阶熵都要大。

查看全文

相关阅读:
生成指定范围的随机数
 sql
map的使用
 基础03 JVM到底在哪里？
Elasticsearch6.1.0 TransportClient聚合查询索引中所有数据
 Elasticsearch6.1.0 TransportClient滚动查询索引中所有数据写入文件中
 elasticsearch-java api中get() 和execute().actionGet()方法
 Elasticsearch6(Transport Client)常用操作
 Reflections反射获取注解下类
 Ambari2.6.0 安装HDP2.6.3: Python script has been killed due to timeout after waiting 300 secs

原文地址：https://www.cnblogs.com/bojack/p/4784751.html

文件名	源文件大小（kb）	压缩后大小（kb）	压缩比
Sena	64	57	89.06%
OMAHA	64	58	90.63%
SINAN	64	61	95.31%

符号	编码
a1	000
a2	0011
a3	01
a4	0010
a5	1

符号	编码
a1	000
a2	01
a3	001
a4	1

符号	编码
a1	00
a2	01
a3	10
a4	11