zoukankan      html  css  js  c++  java
  • YUV格式详细解释与FFMPEG的关系

    YUV主要的采样格式

    主要的采样格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。其中YCbCr 4:1:1 比较常用,其含义为:每个点保存一个 8bit 的亮度值(也就是Y值), 每 2x2 个点保存一个 Cr 和Cb 值, 图像在肉眼中的感觉不会起太大的变化。所以, 原来用 RGB(R,G,B 都是 8bit unsigned) 模型, 4 个点需要 8x3=24 bites(如下图第一个图). 而现在仅需要 8+(8/4)+(8/4)=12bites, 平均每个点占12bites(如下图第二个图)。这样就把图像的数据压缩了一半。

    上边仅给出了理论上的示例,在实际数据存储中是有可能是不同的,下面给出几种具体的存储形式:

    (1)YUV 4:4:4

    YUV三个信道的抽样率相同,因此在生成的图像里,每个象素的三个分量信息完整(每个分量通常8比特),经过8比特量化之后,未经压缩的每个像素占用3个字节。

    下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

    存放的码流为:        Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3 V3

    (2)YUV 4:2:2

    每个色差信道的抽样率是亮度信道的一半,所以水平方向的色度抽样率只是4:4:4的一半。对非压缩的8比特量化的图像来说,每个由两个水平方向相邻的像素组成的宏像素需要占用4字节内存。

    下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

    存放的码流为:       Y0 U0 Y1 V1 Y2 U2 Y3 V3

    映射出像素点为:  [Y0 U0 V1] [Y1 U0 V1] [Y2 U2 V3] [Y3 U2 V3]

    (3)YUV 4:1:1

    4:1:1的色度抽样,是在水平方向上对色度进行4:1抽样。对于低端用户和消费类产品这仍然是可以接受的。对非压缩的8比特量化的视频来说,每个由4个水平方向相邻的像素组成的宏像素需要占用6字节内存

    下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

    存放的码流为:        Y0 U0 Y1 Y2 V2 Y3

    映射出像素点为:  [Y0 U0 V2] [Y1 U0 V2] [Y2 U0 V2] [Y3 U0 V2]

    (4)YUV4:2:0

    4:2:0并不意味着只有Y,Cb而没有Cr分量。它指得是对每行扫描线来说,只有一种色度分量以2:1的抽样率存储。进行隔行扫描,相邻的扫描行存储不同的色度分量,也就是说,如果一行是4:2:0的话,下一行就是4:0:2,再下一行是4:2:0...以此类推。对每个色度分量来说,水平方向和竖直方向的抽样率都是2:1,所以可以说色度的抽样率是4:1。对非压缩的8比特量化的视频来说,每个由2x2个2行2列相邻的像素组成的宏像素需要占用6字节内存。

    下面八个像素为:     [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

                               [Y5 U5 V5] [Y6 U6 V6] [Y7U7 V7] [Y8 U8 V8]

    存放的码流为:        Y0 U0 Y1 Y2 U2 Y3

                               Y5 V5 Y6 Y7 V7 Y8

    映射出的像素点为: [Y0 U0 V5] [Y1 U0 V5] [Y2 U2 V7] [Y3 U2 V7]

                              [Y5 U0 V5] [Y6 U0 V5] [Y7U2 V7] [Y8 U2 V7]

    对应AVPicture里面有data[4]和linesize[4]其中data是一个指向指针的指针(二级、二维指针),也就是指向视频数据缓冲区的首地址,而data[0]~data[3]是一级指针,可以用如下的图来表示:

    data -->xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
    ^ ^ ^
    | | |
    data[0] data[1] data[2]

    比如说,当pix_fmt=PIX_FMT_YUV420P时,data中的数据是按照YUV的格式存储的,也就是:

    data -->YYYYYYYYYYYYYYUUUUUUUUUUUUUVVVVVVVVVVVV
    ^ ^ ^
    | | |
    data[0] data[1] data[2]
    linesize是指对应于每一行的大小,为什么需要这个变量,是因为在YUV格式和RGB格式时,每行的大小不一定等于图像的宽度,对于RGB格式输出时,只有一个通道(bgrbgrbgr......)可用,即linesize[0],和data[0],so RGB24 : data[0] = packet rgb//bgrbgrbgr......

    linesize[0] = width*3
    其他的如data[1][2][3]与linesize[1][2][3]无任何意义.

    而对于YUV格式输出时,有三个通道可用,即data[0][1][2],与linesize[0][1][2],而yuv格式对于运动估计时,需要填充padding(right, bottom),故:

    linesize=width+padding size(16+16).
    ///////////////////////////////////////////////////////////////////////////////////////

     1    case PIX_FMT_YUV420P:
     2    case PIX_FMT_YUVJ420P:
     3    case PIX_FMT_RGB555:
     4         if (PIC_DIRECTION_0 == m_dwFilpPicDirection)
     5         {
     6             m_pYuvFrame->data [0] += m_pYuvFrame->linesize[0] *  m_pVCodecContext->height;
     7             //因为是隔行扫描U与V只有高度的一半
     8             m_pYuvFrame->data [1] += m_pYuvFrame->linesize[1] *  m_pVCodecContext->height/2;
     9             m_pYuvFrame->data [2] += m_pYuvFrame->linesize[2] *  m_pVCodecContext->height/2;
    10             m_pYuvFrame->linesize[0] = -m_pYuvFrame->linesize[0];
    11             m_pYuvFrame->linesize[1] = -m_pYuvFrame->linesize[1];
    12             m_pYuvFrame->linesize[2] = -m_pYuvFrame->linesize[2];
    13         }
    14         break;
    15 
    16    case PIX_FMT_YUVJ422P:
    17    case PIX_FMT_YUV422P:
    18    case PIX_FMT_YUYVJ422:
    19    case PIX_FMT_YUV411P:
    20    case PIX_FMT_YUYV422:  
    21         if (PIC_DIRECTION_0 == m_dwFilpPicDirection)
    22         {
    23             m_pYuvFrame->data [0] += m_pYuvFrame->linesize[0] *  m_pVCodecContext->height;
    24             m_pYuvFrame->data [1] += m_pYuvFrame->linesize[1] *  m_pVCodecContext->height;
    25             m_pYuvFrame->data [2] += m_pYuvFrame->linesize[2] *  m_pVCodecContext->height;
    26             m_pYuvFrame->linesize[0] = -m_pYuvFrame->linesize[0];
    27             m_pYuvFrame->linesize[1] = -m_pYuvFrame->linesize[1];
    28             m_pYuvFrame->linesize[2] = -m_pYuvFrame->linesize[2];
    29         }
    30         break;

    在FFMPEG中转换RGB时顺便颠倒图像的方向算法

  • 相关阅读:
    常见sql注入的防范总结
    Hadoop各个组件与端口
    Jenkins HA高可用参考
    zookeeper的主要应用
    Jenkins常见REST API(便于将Jenkins集成到其他系统)
    使用pscp/pslurp批量并发分发/回收文件
    kv数据库对比总结
    /usr/bin/curl: Argument list too long的解决方法
    优秀的开源监控系统梳理
    Linux socat轻松实现TCP/UDP端口转发
  • 原文地址:https://www.cnblogs.com/eustoma/p/6664855.html
Copyright © 2011-2022 走看看