痞子衡嵌入式：利用i.MXRT1xxx系列内部DCP引擎计算Hash值时需特别处理L1 D-Cache - 走看看

zoukankan html css js c++ java

痞子衡嵌入式：利用i.MXRT1xxx系列内部DCP引擎计算Hash值时需特别处理L1 D-Cache
　　大家好，我是痞子衡，是正经搞技术的痞子。今天痞子衡给大家介绍的是利用i.MXRT1xxx系列内部DCP引擎计算Hash值时需特别处理L1 D-Cache。

　　关于i.MXRT1xxx系列内部通用数据协处理器DCP模块，痞子衡之前写过一篇文章《SNVS Master Key仅在i.MXRT10xx Hab关闭时才能用于DCP加解密》介绍了DCP基本功能和AES加解密使用注意事项，实际上DCP模块除了对AES加解密算法支持外，还支持经典的Hash算法（SHA-1/SHA-256/CRC32）。

　　痞子衡最近支持一个i.MXRT大客户，他们项目里使用了DCP做Hash运算，但会出现概率性Hash校验失败的情况（差不多运行50次，会失败1次），这是什么情况？

一、客户项目基本情况

　　先介绍下客户基本情况，他们项目使用的主芯片是i.MXRT1062，并且配置了外部串行Flash存储程序代码(XiP)，以及外部SDRAM放置程序数据区（其实主要是做frameBuffer的，但也同时放置了.data段和STACK），项目基于的SDK版本是v2.6.2。

　　项目中主要调用了 SDK_2.6.2_EVK-MIMXRT1060middlewarembedtlslibrarysha256.c 中的 mbedtls_sha256() 函数，这个函数其实是通过调用 SDK_2.6.2_EVK-MIMXRT1060middlewarembedtlsportksdkksdk_mbedtls.c 里的一系列底层函数mbedtls_sha256_xx() 来进一步实现的。

　　ksdk_mbedtls.c 文件是同时适用Kinetis/LPC/i.MXRT等系列MCU的，不同MCU上硬件引擎不同（比如有LTC/CAAM/CAU3/DCP/HashCrypt）。对于i.MXRT1xxx，硬件引擎就是DCP，这些 mbedtls_sha256_xx() 函数主要调用了 SDK 标准驱动 fsl_dcp.c 里的如下函数：
```
status_t DCP_HASH_Init(DCP_Type *base, dcp_handle_t *handle, dcp_hash_ctx_t *ctx, dcp_hash_algo_t algo);
status_t DCP_HASH_Update(DCP_Type *base, dcp_hash_ctx_t *ctx, const uint8_t *input, size_t inputSize);
status_t DCP_HASH_Finish(DCP_Type *base, dcp_hash_ctx_t *ctx, uint8_t *output, size_t *outputSize);
```
二、概率性失败情况分析

　　既然是概率性失败的问题，那大概率和Cache处理有关了，我们需要检查下 fsl_dcp.c 驱动是否很好地处理了Cache。让我们打开 SDK_2.6.2_EVK-MIMXRT1060oardsevkmimxrt1060driver_examplesdcp 例程先看一下，在 dcp.c 文件的 main() 函数里可以看到明显的提醒。如果项目里用到了SDRAM，必须将DCache关掉，说明 dcp 驱动并不支持在DCache使能下运行。但显然这个客户项目用到了SDRAM，后来跟客户确认，他们DCache一直是使能的，这显然是有问题的。
```
int main(void)
{
    dcp_config_t dcpConfig;

    /* Init hardware*/
    BOARD_ConfigMPU();
    BOARD_InitPins();
    BOARD_BootClockRUN();
    BOARD_InitDebugConsole();

    /* Data cache must be temporarily disabled to be able to use sdram */
    SCB_DisableDCache();

    ...
```
　　让我们再次回到SDK版本，在恩智浦SDK下载主页可以看到所有i.MXRT1060 SDK历史版本，v2.6.2是2019年7月发布的（这个版本里的dcp驱动版本是v2.1.1），是的，这个客户算是i.MXRT早期客户了。而现在最新的SDK版本已经是v2.9.3（dcp驱动已经升级到v2.1.6），时间快过去两年了，客户并没有实时更新SDK版本。

　　早期的 dcp 驱动没有处理DCache，所以其必须在 DCache 关掉的情况下才能正常工作。从v2.1.5开始增加了对 DCache 的处理，这样 dcp 驱动就可以在 DCache 使能的情况下正常工作了。

三、DCP驱动里是如何处理DCache的？

　　现在让我们在SDK标准驱动 fsl_dcp.c 中看一下它到底是怎么增加对DCache处理的。

3.1 DCP上下文buffer设置

　　使用 dcp 驱动的第一步是DCP模块初始化，即DCP_Init()函数，这个函数会在DCP->CTRL寄存器里将模块全部的四通道都使能以及将上下文(Context)的缓存和通道自切换功能也都开启，其中关于上下文切换有一个重要的私有全局变量 s_dcpContextSwitchingBuffer，这个变量被放置到了NON-CACHE区域（驱动改进处一）。下述DCP->CONTEXT寄存器就是用来存储 s_dcpContextSwitchingBuffer 地址的。
```
AT_NONCACHEABLE_SECTION_INIT(static dcp_context_t s_dcpContextSwitchingBuffer);

void DCP_Init(DCP_Type *base, const dcp_config_t *config)
{
    // 代码省略...

    /* use context switching buffer */
    base->CONTEXT = (uint32_t)&s_dcpContextSwitchingBuffer;
}
```
3.2 DCP用户数据in/out buffer设置

　　DCP 模块初始化完成后，就是调用 dcp 驱动里的DCP_HASH()函数进行Hash运算，这个函数参数里有两个用户Buffer，一个Input Buffer存放待计算的消息数据，另一个Output Buffer存放计算好的Hash值（SHA256是32bytes），这两个Buffer最好由用户处理放置在NON-CACHE区。
```
/* Input data for DCP like input and output should be handled properly
 * when DCACHE is used (e.g. Clean&Invalidate, use non-cached memory)
 */
AT_NONCACHEABLE_SECTION(static uint8_t s_outputSha256[32]);

status_t calc_sha256(const uint8_t *messageBuf, uint32_t messageLen)
{
    size_t outLength = sizeof(s_outputSha256);
    dcp_handle_t m_handle;
    m_handle.channel    = kDCP_Channel0;
    m_handle.keySlot    = kDCP_KeySlot0;
    m_handle.swapConfig = kDCP_NoSwap;

    memset(&s_outputSha256, 0, outLength);

    return DCP_HASH(DCP, &m_handle, kDCP_Sha256, messageBuf, messageLen, s_outputSha256, &outLength);
}
```
3.3 DCP_HASH()相关代码中DCache处理

　　DCP_HASH()函数运行过程中会一直用到一个非常关键的内部结构体 dcp_hash_ctx_internal_t，这个结构体大小为47 Words（包含128byte的待计算消息数据块blk、32bytes实时计算结果runningHash、及其他辅助变量成员）。
```
/*! internal dcp_hash context structure */
typedef struct _dcp_hash_ctx_internal
{
    dcp_hash_block_t blk;        /*!< memory buffer. only full blocks are written to DCP during hash updates */
    size_t blksz;                /*!< number of valid bytes in memory buffer */
    dcp_hash_algo_t algo;        /*!< selected algorithm from the set of supported algorithms */
    dcp_hash_algo_state_t state; /*!< finite machine state of the hash software process */
    uint32_t fullMessageSize;    /*!< track message size */
    uint32_t ctrl0;              /*!< HASH_INIT and HASH_TERM flags */
    uint32_t runningHash[9];     /*!< running hash. up to SHA-256 plus size, that is 36 bytes. */
    dcp_handle_t *handle;
} dcp_hash_ctx_internal_t;
```
　　dcp 驱动直接定义了 dcp_hash_ctx_t 型局部变量hashCtx，hashCtx空间后续会被用作dcp_hash_ctx_internal_t。旧版本里DCP_HASH_CTX_SIZE值为58，新版本增加到64，这是为了后续L1DCACHE的LINE对齐（驱动改进处二）。
```
/*! @brief DCP HASH Context size. */
#define DCP_HASH_CTX_SIZE 64

/*! @brief Storage type used to save hash context. */
typedef struct _dcp_hash_ctx_t
{
    uint32_t x[DCP_HASH_CTX_SIZE];
} dcp_hash_ctx_t;

status_t DCP_HASH(DCP_Type *base, dcp_handle_t *handle, dcp_hash_algo_t algo, const uint8_t *input, size_t inputSize, uint8_t *output, size_t *outputSize)
{
    dcp_hash_ctx_t hashCtx = {0};
    status_t status;

    status = DCP_HASH_Init(base, handle, &hashCtx, algo);
    status = DCP_HASH_Update(base, &hashCtx, input, inputSize);
    status = DCP_HASH_Finish(base, &hashCtx, output, outputSize);
    // ...
}

status_t DCP_HASH_Init/Update/Finish(...，dcp_hash_ctx_t *ctx，...)
{
    dcp_hash_ctx_internal_t *ctxInternal;
    /* Align structure on DCACHE line*/
#if defined(__DCACHE_PRESENT) && (__DCACHE_PRESENT == 1U) && defined(DCP_USE_DCACHE) && (DCP_USE_DCACHE == 1U)
    ctxInternal = (dcp_hash_ctx_internal_t *)(uint32_t)((uint8_t *)ctx + FSL_FEATURE_L1DCACHE_LINESIZE_BYTE);
#else
    ctxInternal = (dcp_hash_ctx_internal_t *)(uint32_t)ctx;
#endif

    // 代码省略...
}
```
　　DCP_HASH()函数中启动DCP引擎去计算消息块数据前，都会调用 DCACHE_InvalidateByRange() 函数对 ctxInternal 所占空间做清理（驱动改进处三）。启动DCP引擎工作一次的函数是dcp_hash_update()，这个函数会利用 dcp_work_packet_t 型结构体变量，对于这个结构，代码中也同样做了L1DCACHE对齐处理（驱动改进处四）：
```
/*! @brief DCP's work packet. */
typedef struct _dcp_work_packet
{
    uint32_t nextCmdAddress;
    uint32_t control0;
    uint32_t control1;
    uint32_t sourceBufferAddress;
    uint32_t destinationBufferAddress;
    uint32_t bufferSize;
    uint32_t payloadPointer;
    uint32_t status;
} dcp_work_packet_t;

#if defined(__DCACHE_PRESENT) && (__DCACHE_PRESENT == 1U) && defined(DCP_USE_DCACHE) && (DCP_USE_DCACHE == 1U)
static inline uint32_t *DCP_FindCacheLine(uint8_t *dcpWorkExt)
{
    while (0U != ((uint32_t)dcpWorkExt & ((uint32_t)FSL_FEATURE_L1DCACHE_LINESIZE_BYTE - 1U)))
    {
        dcpWorkExt++;
    }
    return (uint32_t *)(uint32_t)dcpWorkExt;
}
#endif

static status_t dcp_hash_update(DCP_Type *base, dcp_hash_ctx_internal_t *ctxInternal, const uint8_t *msg, size_t size)
{
    status_t completionStatus = kStatus_Fail;

    /* Use extended  DCACHE line size aligned structure */
#if defined(__DCACHE_PRESENT) && (__DCACHE_PRESENT == 1U) && defined(DCP_USE_DCACHE) && (DCP_USE_DCACHE == 1U)
    dcp_work_packet_t *dcpWork;
    uint8_t dcpWorkExt[sizeof(dcp_work_packet_t) + FSL_FEATURE_L1DCACHE_LINESIZE_BYTE] = {0U};
    dcpWork = (dcp_work_packet_t *)(uint32_t)DCP_FindCacheLine(dcpWorkExt);
#else
    dcp_work_packet_t dcpWorkPacket = {0};
    dcp_work_packet_t *dcpWork      = &dcpWorkPacket;
#endif

    do
    {
        completionStatus = dcp_hash_update_non_blocking(base, ctxInternal, dcpWork, msg, size);
    } while (completionStatus == (int32_t)kStatus_DCP_Again);

    completionStatus = DCP_WaitForChannelComplete(base, ctxInternal->handle);

    ctxInternal->ctrl0 = 0;
    return (completionStatus);
}
```
　　至此，利用i.MXRT1xxx系列内部DCP引擎计算Hash值时需特别处理L1 D-Cache痞子衡便介绍完毕了，掌声在哪里~~~

欢迎订阅

文章会同时发布到我的博客园主页、CSDN主页、知乎主页、微信公众号平台上。

微信搜索"痞子衡嵌入式"或者扫描下面二维码，就可以在手机上第一时间看了哦。
  最后欢迎关注痞子衡个人微信公众号【痞子衡嵌入式】，一个专注嵌入式技术的公众号，跟着痞子衡一起玩转嵌入式。

  衡杰(痞子衡)，目前就职于恩智浦MCU系统部门，担任嵌入式系统应用工程师。

  专栏内所有文章的转载请注明出处：http://www.cnblogs.com/henjay724/

  与痞子衡进一步交流或咨询业务合作请发邮件至 hengjie1989@foxmail.com

  可以关注痞子衡的Github主页 https://github.com/JayHeng，有很多好玩的嵌入式项目。

  关于专栏文章有任何疑问请直接在博客下面留言，痞子衡会及时回复免费(划重点)答疑。

  痞子衡邮箱已被私信挤爆，技术问题不推荐私信，坚持私信请先扫码付款(5元起步)再发。
查看全文

相关阅读:
Httprunner生成Allure格式HTML报告
 Go语言编写单元测试用例
 dotnet 在 UOS 国产系统上安装 dotnet sdk 的方法
 dotnet 在国产 UOS 系统利用 dotnet tool 工具做文件传输
 webpack丑化插件
 webpack自动生成html
webpack vue
webpack vue
HO引擎近况20210225
常用十大算法（三）— 动态规划算法

原文地址：https://www.cnblogs.com/henjay724/p/14709872.html

Copyright © 2011-2022 走看看