zoukankan      html  css  js  c++  java
  • 【秒懂音视频开发】18_详解YUV

    本文的主角是多媒体领域非常重要的一个概念:YUV。

    简介

    YUV,是一种颜色编码方法,跟RGB是同一个级别的概念,广泛应用于多媒体领域中。

    也就是说,图像中每1个像素的颜色信息,除了可以用RGB的方式表示,也可以用YUV的方式表示。

    vs RGB

    对比RGB,YUV有哪些不同和优势呢?

    体积更小

    • 如果使用RGB
      • 比如RGB888(R、G、B每个分量都是8bit)
      • 1个像素占用24bit(3字节)
    • 如果使用YUV
      • 1个像素可以减小至平均只占用12bit(1.5字节)
      • 体积为RGB888的一半

    组成

    RGB数据由R、G、B三个分量组成。

    YUV数据由Y、U、V三个分量组成,现在通常说的YUV指的是YCbCr

    • Y:表示亮度(Luminance、Luma),占8bit(1字节)
    • CbCr:表示色度(Chrominance、Chroma)
      • Cb(U):蓝色色度分量,占8bit(1字节)
      • Cr(V):红色色度分量,占8bit(1字节)

    YCbCr

    当Y等于0.5时

    兼容性

    原始图像

    RGB

    YCbCr

    根据上面的图片,不难看出:

    • Y分量对呈现出清晰的图像有着很大的贡献
    • Cb、Cr分量的内容不太容易识别清楚

    此外,你是否感觉:Y分量的内容看着有点眼熟?其实以前黑白电视的画面就是长这样子的。

    YUV的发明处在彩色电视与黑白电视的过渡时期。

    • YUV将亮度信息(Y)与色度信息(UV)分离,没有UV信息一样可以显示完整的图像,只不过是黑白的
    • 这样的设计很好地解决了彩色电视与黑白电视的兼容性问题,使黑白电视也能够接收彩色电视信号,只不过它只显示了Y分量
    • 彩色电视有Y、U、V分量,如果去掉UV分量,剩下的Y分量和黑白电视相同

    转换

    公式1

    Y = 0.257R + 0.504G + 0.098B + 16
    U = -0.148R - 0.291G + 0.439B + 128
    V = 0.439R - 0.368G - 0.071B + 128
    
    R = 1.164(Y - 16) + 2.018(U - 128)
    G = 1.164(Y - 16) - 0.813(V - 128) - 0.391(U - 128)
    B = 1.164(Y - 16) + 1.596(V - 128)
    
    • RGB的取值范围是[0,255]
    • Y的取值范围是[16,235]
    • UV的取值范围是[16,239]

    公式2

    Y = 0.299R + 0.587G + 0.114B
    U = 0.564(B - Y) = -0.169R - 0.331G + 0.500B
    V = 0.713(R - Y) = 0.500R - 0.419G - 0.081B
    
    R = Y + 1.403V
    G = Y - 0.344U - 0.714V
    B = Y + 1.770U
    
    • RGB的取值范围是[0, 1]
    • Y的取值范围是[0, 1]
    • UV的取值范围是[-0.5, 0.5]

    公式3

    Y = 0.299R + 0.587G + 0.114B
    U = -0.169R - 0.331G + 0.500B + 128
    V = 0.500R - 0.419G - 0.081B + 128
    
    R = Y + 1.403(V - 128)
    G = Y - 0.343(U - 128) - 0.714(V - 128)
    B = Y + 1.770(U - 128)
    
    • RGB的取值范围是[0, 255]
    • YUV的取值范围是[0, 255]

    色度二次采样

    原理

    人眼的视网膜上,分布着两种感光细胞:视杆细胞视锥细胞

    视网膜

    • 视杆细胞

      • 感知光线的强弱
      • 没有色彩识别功能
      • 负责夜间非彩色视觉
    • 视锥细胞

      • 感知颜色
      • 负责白天彩色视觉
      • 如果你的视锥细胞发育不正常,数量太少,那感知颜色就会受阻,可能会导致你色弱

    视杆细胞和视锥细胞

    人眼中有上亿个感光细胞,其中视杆细胞占了95%,而视锥细胞仅占5%。

    因此,人眼对亮度的敏感程度要高于对色度的敏感程度,人眼对于亮度的分辨要比对颜色的分辨精细一些。

    如果把图像的色度分量减少一些,人眼也丝毫感觉不到变化和差异。

    概念

    如果在色度分量上进行(相对亮度分量)较低分辨率的采样,也就是存储较多的亮度细节、较少的色度细节,这样就可以在不明显降低画面质量的同时减小图像的体积。上述过程称为:色度二次采样(Chroma Subsampling)。

    采样格式

    采样格式通常用A:B:C的形式来表示,比如4:4:4、4:2:2、4:2:0等,其中我们最需要关注的是4:2:0

    • A:一块A*2个像素的概念区域,一般都是4
    • B:第1行的色度采样数目
    • C:第2行的色度采样数目
      • C的值一般要么等于B,要么等于0

    色度二次采样

    色度二次采样

    上图中,不管是哪种采样格式,Y分量都是全水平、全垂直分辨率采样的,每一个像素都有自己独立的Y分量。

    4:4:4

    • 第1行采集4组CbCr分量,第2行采集4组CbCr分量
    • 每1个像素都有自己独立的1组CbCr分量
      • Y分量与CbCr分量的水平方向比例是1:1(每1列都有1组CbCr分量)
      • Y分量与CbCr分量的垂直方向比例是1:1(每1行都有1组CbCr分量)
      • Y分量与CbCr分量的总比例是1:1
    • 1个像素占用24bit(3字节),跟RGB888的体积一样
      • 24bpp(bits per pixel)
    • 这种格式是没有进行色度二次采样的

    4:4:4

    叉叉代表:亮度。

    圆圈代表:色度。

    4:2:2

    • 第1行采集2组CbCr分量,第2行采集2组CbCr分量
    • 水平方向相邻的2个像素(1行2列)共用1组CbCr分量
      • Y分量与CbCr分量的水平方向比例是2:1(每2列就有1组CbCr分量)
      • Y分量与CbCr分量的垂直方向比例是1:1(每1行都有1组CbCr分量)
      • Y分量与CbCr分量的总比例是2:1
    • 1个像素平均占用16bit(2字节)
      • 16bpp
      • 因为2个像素共占用32bit(4字节 = 2个Y分量 + 1个Cb分量 + 1个Cr分量)

    4:2:2

    4:2:0

    • 第1行采集2组CbCr分量,第2行共享第1行的CbCr分量
    • 相邻的4个像素(2行2列)共用1组CbCr分量
      • Y分量与CbCr分量的水平方向比例是2:1(每2列就有1组CbCr分量)
      • Y分量与CbCr分量的垂直方向比例是2:1(每2行就有1组CbCr分量)
      • Y分量与CbCr分量的总比例是4:1
    • 1个像素平均占用12bit(1.5字节)
      • 12bpp
      • 因为4个像素共占用48bit(6字节 = 4个Y分量 + 1个Cb分量 + 1个Cr分量)

    4:2:0 MPEG-1

    4:2:0 MPEG-2

    存储格式

    存储格式,决定了YUV数据是如何排列和存储的。本文只介绍一些常见的存储格式。

    分类

    YUV的存储格式可以分为3大类:

    • Planar(平面)
      • Y、U、V分量分开单独存储
      • 名称通常以字母p结尾
    • Semi-Planar(半平面)
      • Y分量单独存储,U、V分量交错存储
      • 名称通常以字母sp结尾
    • Packed(紧凑)
      • 或者叫Interleaved (交错)
      • Y、U、V分量交错存储

    4:4:4

    4:4:4

    Planar

    • I444
    Y Y Y Y
    Y Y Y Y
    U U U U
    U U U U
    V V V V
    V V V V
    
    • YV24
    Y Y Y Y
    Y Y Y Y
    V V V V
    V V V V
    U U U U
    U U U U
    

    Semi-Planar

    • NV24
    Y Y Y Y
    Y Y Y Y
    U V U V U V U V
    U V U V U V U V
    
    • NV42
    Y Y Y Y
    Y Y Y Y
    V U V U V U V U
    V U V U V U V U
    

    4:2:2

    4:2:2

    Planar

    • I422
    Y Y Y Y
    Y Y Y Y
    U U
    U U
    V V
    V V
    
    • YV16
    Y Y Y Y
    Y Y Y Y
    V V
    V V
    U U
    U U
    

    Semi-Planar

    • NV16
    Y Y Y Y
    Y Y Y Y
    U V U V
    U V U V
    
    • NV61
    Y Y Y Y
    Y Y Y Y
    V U V U
    V U V U
    

    Packed

    • UYVY
    U Y V Y U Y V Y
    U Y V Y U Y V Y
    
    • YUYV
    Y U Y V Y U Y V 
    Y U Y V Y U Y V 
    
    • YVYU
    Y V Y U Y V Y U
    Y V Y U Y V Y U
    

    4:2:0

    4:2:0

    Planar

    • I420
      • 大多数视频解码器以I420格式输出原始图片
    Y Y Y Y
    Y Y Y Y
    U U
    V V
    

    I420

    • YV12
    Y Y Y Y
    Y Y Y Y
    V V
    U U
    

    Semi-Planar

    • NV12
    Y Y Y Y
    Y Y Y Y
    U V U V
    
    • NV21
    Y Y Y Y
    Y Y Y Y
    V U V U
    

    4:2:0

    格式转换

    其他图片格式转YUV

    ffmpeg -i in.png -s 512x512 -pix_fmt yuv420p out.yuv
    

    上述命令生成的yuv文件大小是:393216字节 = 512 * 512 * 1.5字节。

    • -s
      • 设置图片的尺寸
      • 可以用一些固定字符串表示尺寸,比如hd720表示1280x720
      • 如果不设置此选项,默认会跟随输入图片的尺寸
    • -pix_fmt
      • 设置像素格式
      • 可以通过ffmpeg -pix_fmts查看FFmpeg支持的像素格式
      • 如果不设置此选项,默认会跟随输入图片的像素格式
        • 比如可能是rgb24rgba8pal8
        • 可以通过ffprobe查看某图片的像素格式,比如ffprobe in.png

    YUV转其他图片格式

    ffmpeg -s 512x512 -pix_fmt yuv420p -i in.yuv out.jpg
    
    • 这里必须得设置YUV的尺寸(-s)、像素格式(-pix_fmt
    • 这就类似于:对pcm进行编码时,必须得设置采样率(-ar)、声道数(-ac)、采样格式(-f

    显示YUV

    完整的YUV

    可以通过ffplay显示YUV数据。

    • YUV中直接存储的是所有像素的颜色信息(可以理解为是图像的一种原始数据)

    • 必须得设置YUV的尺寸(-s)、像素格式(-pix_fmt)才能正常显示

    • 这就类似于:播放pcm时,必须得设置采样率(-ar)、声道数(-ac)、采样格式(-f

    ffplay -s 512x512 -pix_fmt yuv420p in.yuv
    
    # 在ffplay中
    # -s已经过期,建议改为:-video_size
    # -pix_fmt已经过期,建议改为:-pixel_format
    ffplay -video_size 512x512 -pixel_format yuv420p in.yuv
    

    单个分量

    可以使用过滤器(filter)显示其中的单个分量(r、g、b、y、u、v)。

    # 只显示r分量
    ffplay -vf extractplanes=r in.png
    
    # 只显示g分量
    ffplay -vf extractplanes=g in.png
    
    # 只显示b分量
    ffplay -vf extractplanes=b in.png
    
    # 只显示y分量
    ffplay -video_size 512x512 -pixel_format yuv420p -vf extractplanes=y in.yuv
    # 只显示y分量
    ffplay -video_size 512x512 -pixel_format yuv420p -vf extractplanes=u in.yuv
    # 只显示y分量
    ffplay -video_size 512x512 -pixel_format yuv420p -vf extractplanes=v in.yuv
    
    • -vf
      • 设置视频过滤器
      • 等价写法:-filter:v
    • extractplanes
      • 抽取单个分量的内容到灰度视频流中
  • 相关阅读:
    线段树(题集
    T3——拆分自然数
    P1309 瑞士轮
    普通母函数简单使用
    双向广度优先搜索
    秦九韶算法
    P1043-数字游戏
    网站在阿里云备案的详细全过程详细步骤
    从git拉取代码后经常出现maven窗口不见
    SpringBoot入门教程之打成war包在tomcat容器中执行
  • 原文地址:https://www.cnblogs.com/mjios/p/14686970.html
Copyright © 2011-2022 走看看