zoukankan html css js c++ java

基于FFmpeg的Dxva2硬解码及Direct3D显示（四）

初始化硬解码上下文

初始化硬解码上下文

创建解码数据缓冲区

这一步为了得到 LPDIRECT3DSURFACE9* 实例 m_pSurface，就是之前说过的那个数组。

// m_surfaceNums 为希望创建的缓冲区个数，单路视频一个就够了，太多可能显存不够用
m_pSurface = (LPDIRECT3DSURFACE9*)av_mallocz(m_surfaceNums * sizeof(LPDIRECT3DSURFACE9));
if (!m_pSurface)
{
    return FALSE;
}

// 字节对齐
int surfaceAlignment = 0;
if (pCodecCtx->codec_id == AV_CODEC_ID_MPEG2VIDEO)
{
    surfaceAlignment = 32;
}
else if (pCodecCtx->codec_id == AV_CODEC_ID_HEVC)
{
    surfaceAlignment = 128;
}
else
{
    surfaceAlignment = 16;
}

// 创建缓冲区
HRESULT hr = m_pDecoderService->CreateSurface(
    FFALIGN(pCodecCtx->coded_width, surfaceAlignment),	// 缓冲区宽
    FFALIGN(pCodecCtx->coded_height, surfaceAlignment),	// 缓冲区高
    m_surfaceNums,					// 缓冲区个数，这里可以设置为0，CreateVideoDecoder里面会重新设置个数
    m_renderFormat,					// 缓冲区格式
    D3DPOOL_DEFAULT,				// 缓冲区位置，D3DPOOL_DEFAULT--显存
    0,								// 资源如何被使用					
    DXVA2_VideoDecoderRenderTarget,	// 缓冲区为视频解码器渲染目标
    m_pSurface,						// 缓冲区数组指针
    NULL);							// 保留字

if (FAILED(hr))
{
    return FALSE;
}

创建IDirectXVideoDecoder视频解码器

获取当前GPU支持的解码能力等级和渲染格式

BOOL GetDxva2FormatAndGuid(AVCodecContext *pCodecCtx, GUID & guid, D3DFORMAT & fmt)
{
	// 获取当前设备支持的解码标准等级标识列表
	GUID *guidList = NULL;
	unsigned guidCount = 0;

	HRESULT hr = m_pDecoderService->GetDecoderDeviceGuids(&guidCount, &guidList);
	if (FAILED(hr))
	{
		VX_LOG_ERROR("Get hardware acclerate device guids failed!");
		return FALSE;
	}

	for (int i = 0; ; i++)
	{
		if (NULL == guid2AVCodecID[i].guidID)
		{
			// 查到最后一个了直接退出循环
			break;
		}

		const Guid2CodecID *mode = &guid2AVCodecID[i];

		if (mode->codecID == pCodecCtx->codec_id)
		{
			for (uint32_t j = 0; j < guidCount; j++)
			{
				if (IsEqualGUID(*mode->guidID, guidList[j]))
				{
					// 获取当前解码标准下渲染器目标格式数组
					D3DFORMAT *targetList = NULL;
					UINT targetCount = 0;
					hr = m_pDecoderService->GetDecoderRenderTargets(*mode->guidID, &targetCount, &targetList);
					if (FAILED(hr))
					{
						VX_LOG_ERROR("Get support render format failed!");
						return FALSE;
					}

					for (uint32_t j = 0; j < targetCount; j++)
					{
						if (targetList[j] == MKTAG('N', 'V', '1', '2'))
						{
							fmt = targetList[j];
							guid = *mode->guidID;
							break;
						}
					}
					// 释放内存资源
					CoTaskMemFree(targetList);
				}
			}
		}
	}

	CoTaskMemFree(guidList);

	if (D3DFMT_UNKNOWN == fmt || GUID_NULL == guid)
	{
		return FALSE;
	}
	else
	{
		return TRUE;
	}
}

获取当前解码等级下的配置信息

void CDxva2Decode::GetDecoderCfg(AVCodecContext *pCodecCtx, const GUID *pGuid,
								const DXVA2_VideoDesc *pDesc, DXVA2_ConfigPictureDecode *pCfg)
{
	unsigned cfgCount = 0, bestScore = 0;
	DXVA2_ConfigPictureDecode *cfgList = NULL;

	HRESULT hr = m_pDecoderService->GetDecoderConfigurations(*pGuid, pDesc, NULL, &cfgCount, &cfgList);

	for (uint32_t i = 0; i < cfgCount; i++)
	{
		DXVA2_ConfigPictureDecode cfg = cfgList[i];

		unsigned score;

		if (cfg.ConfigBitstreamRaw == 1)
		{
			score = 1;
		}
		else if (pCodecCtx->codec_id == AV_CODEC_ID_H264 && cfg.ConfigBitstreamRaw == 2)
		{
			score = 2;
		}
		else
		{
			continue;
		}

		if (IsEqualGUID(cfg.guidConfigBitstreamEncryption, DXVA2_NoEncrypt))
		{
			score += 16;
		}

		if (score > bestScore)
		{
			bestScore = score;
			*pCfg = cfg;
		}
	}

	CoTaskMemFree(cfgList);
}

这一步为了得到 IDirectXVideoDecoder* 实例 m_pDxva2Decoder，亦即硬件解码器。

if (!GetDxva2FormatAndGuid(pCodecCtx, m_decoderGuid, m_renderFormat))
{
    // 不支持DXVA2加速
    VX_LOG_ERROR("Do not support Dxva2!");
    return FALSE;
}

// 设置解码后的格式
DXVA2_VideoDesc desc = { 0 };
desc.SampleWidth = pCodecCtx->coded_width;
desc.SampleHeight = pCodecCtx->coded_height;
desc.Format = m_renderFormat;

// 获取支持的配置
GetDecoderCfg(pCodecCtx, &m_decoderGuid, &desc, &m_config);

// 创建解码器设备
HRESULT hr = m_pDecoderService->CreateVideoDecoder(m_decoderGuid,		// 设备标识符
                                                   &desc,				// 视频内容描述
                                                   &m_config,			// 解码器配置
                                                   m_pSurface,			// 渲染目标数组指针(解码后的数据写到这里)
                                                   m_surfaceNums,		// 渲染目标数，必须大于0，
                                                   &m_pDxva2Decoder);	// 解码器

if (FAILED(hr))
{
    return FALSE;
}

设置硬解码上下文

// 这一步为了将解码缓冲区数组传给GetBufferCallBack回调函数
pCodecCtx->opaque = m_pSurface;

// 设置回调
pCodecCtx->get_buffer2 = GetBufferCallBack;
pCodecCtx->get_format = GetHwFormat;

// 单路视频启动多线程解码，理解是启用多个线程将待解码数据送往GPU，因为数据从内存到显存比较慢
pCodecCtx->thread_safe_callbacks = TRUE;
pCodecCtx->thread_count = 2;

// 为解码器上下文申请硬件加速内存
pCodecCtx->hwaccel_context = av_mallocz(sizeof(struct dxva_context));
if (!pCodecCtx->hwaccel_context)
{
    return FALSE;
}

// 设置硬件加速上下文
struct dxva_context *dxva2Ctx = (dxva_context *)pCodecCtx->hwaccel_context;
dxva2Ctx->cfg = &m_config;
dxva2Ctx->decoder = m_pDecoder;
dxva2Ctx->surface = m_pSurface;
dxva2Ctx->surface_count = m_surfaceNums;

// 对老的intel GPU 的支持
if (IsEqualGUID(m_decoderGuid, DXVADDI_Intel_ModeH264_E))
{
    dxva2Ctx->workaround |= FF_DXVA2_WORKAROUND_INTEL_CLEARVIDEO;
}

解码回调函数

解码输出格式回调

static AVPixelFormat GetHwFormat(AVCodecContext * pCodecCtx, const AVPixelFormat * pPixFmt)
{
	// 因为采用的是DXVA2，所以这里直接写死了
	return AV_PIX_FMT_DXVA2_VLD;	
}

解码数据回调

此时解码后的数据放在解码缓冲数组里面，这里数组大小为1。单路视频时 pFrame 地址为两个固定地址切换，这些应该都是FFmpeg内部实现的。这里理解的不清楚，希望大神可以指点。

// 个人理解就是将LPDIRECT3DSURFACE9转为(uint8_t *)，同时得保证内存不会立即被释放 
static int GetBufferCallBack(AVCodecContext * pCodecCtx, AVFrame * pFrame, int flags)
{
	if (pFrame->format != AV_PIX_FMT_DXVA2_VLD)
	{
		return -1;
	}

	// 获取解码后的数据，出于安全性不可直接访问，这一步没有内存拷贝
	LPDIRECT3DSURFACE9 surface = ((LPDIRECT3DSURFACE9*)(pCodecCtx->opaque))[0];

	// 将LPDIRECT3DSURFACE9转为AVBuffer，内存地址不变，并返回AVBufferRef，并返回AVBufferRef供FFmpeg内部使用，这一步应该发生了内存拷贝
	// 类似于智能指针，增加对surface的引用计数，当计数为0时FFmpeg会认为该帧数据丢弃掉。默认使用av_buffer_default_free释放，
	pFrame->buf[0] = av_buffer_create((uint8_t*)surface, 0, nullptr, nullptr, AV_BUFFER_FLAG_READONLY);
	if (!pFrame->buf[0])
	{
		return AVERROR(ENOMEM);
	}
	
	// 这一步拿到最终可以显示的数据，必须是data[3]，此时surface应该是AVBuffer
	pFrame->data[3] = (uint8_t *)surface;

	return 0;
}

[参考链接]：（http://www.cnblogs.com/betterwgo/p/6125507.html）

查看全文

相关阅读:
优雅的使用Python之软件管理
 优雅的使用python之环境管理
 SpriteSheet精灵动画引擎
 【译】AS3利用CPU缓存
 走在网页游戏开发的路上（十一）
自定义路径创建Cocos2d-x项目
 C++静态库与动态库
 C++对象模型
 超时空英雄传说2复仇魔神完全攻略&秘技
 从头写个http client（java）

原文地址：https://www.cnblogs.com/huluwa508/p/10304451.html