https://wuyuans.com/2012/11/dct2/
写这篇文章的目的主要是为了给x264打好基础,x264用的是整数DCT变换,所以就先来说说DCT变换吧。
DCT(Discrete Cosine Transform),又叫离散余弦变换,它的第二种类型,经常用于信号和图像数据的压缩。经过DCT变换后的数据能量非常集中,一般只有左上角的数值是非零的,也就是能量都集中在离散余弦变换后的直流和低频部分,下面我会用matlab来演示整个过程。
1.一维DCT变换
我们首先来看看一维的DCT变换,这是二维的基础。一维的DCT变换共有8种,其中最实用的是第二种形式,公式如下:
2.二维DCT变换
二维DCT变换是在一维的基础上再进行一次DCT变换,这个比较好理解,直接看公式:

clear;
clc;
X=round(rand(4)*100);%随机生成的数据
A=zeros(4);%变换矩阵
for i=0:3
for j=0:3
if i==0
a=sqrt(1/4);
else
a=sqrt(2/4);
end
A(i+1,j+1)=a*cos(pi*(j+0.5)*i/4);
end
end
Y=A*X*A';%DCT变换
YY=dct2(X);%用matlab中的函数进行DCT变换
Y是使用上面的公式进行变换,YY是用matlab自带的dct2函数变换,结果是是:
X =
61 19 50 20
82 26 61 45
89 90 82 43
93 59 53 97
Y =
242.5000 32.1613 22.5000 33.2212
-61.8263 7.9246 -10.7344 30.6881
-16.5000 -14.7549 22.5000 -6.8770
8.8322 16.6881 -35.0610 -6.9246
YY =
242.5000 32.1613 22.5000 33.2212
-61.8263 7.9246 -10.7344 30.6881
-16.5000 -14.7549 22.5000 -6.8770
8.8322 16.6881 -35.0610 -6.9246
可以看出Y和YY的结果是一样的,这也进一步验证了上面的公式是正确的。由于X是我随机生成的,相关性很小,变换后的结果比较乱;如果是信号或图像这样相关性比较大的数据的话,数值会集中在左上角,右下角一般都是零,再使用“之”字型扫描得到数据流会包含很多连续的零,编码后数据量会非常小,这就是DCT变换带来的好处。
3.二维DCT反变换
DCT逆变换的公式如下:

clear;
clc;
X=[
61 19 50 20
82 26 61 45
89 90 82 43
93 59 53 97];
A=zeros(4);
for i=0:3
for j=0:3
if i==0
a=sqrt(1/4);
else
a=sqrt(2/4);
end
A(i+1,j+1)=a*cos(pi*(j+0.5)*i/4);
end
end
Y=A*X*A';
X1=A'*Y*A;
X使用的是上面正变换用的数据,运行后得到的X1为:
X1 =
61.0000 19.0000 50.0000 20.0000
82.0000 26.0000 61.0000 45.0000
89.0000 90.0000 82.0000 43.0000
93.0000 59.0000 53.0000 97.0000
和X完全相等。在实际进行编码的时候,比如JPEG压缩的时候,只会对Y左上角的数据进行传输,所以解码出来的内容不会完全和原来的相同。
4.整数DCT变换
说道DCT就顺便提一下x264中的整数DCT变换,整数DCT变换是以DCT变换为基础的,为了减少计算量做的一些调整,下面我写一下整数DCT变换公式的大致推导过程:

作者:wuyuan 本文来自Wuyuan's Blog 转载请注明,谢谢! 文章地址: https://wuyuans.com/2012/11/dct2