zoukankan      html  css  js  c++  java
  • 【STM32F429的DSP教程】第22章 DSP矩阵运算-放缩,乘法和转置矩阵

    完整版教程下载地址:http://www.armbbs.cn/forum.php?mod=viewthread&tid=94547

    第22章       DSP矩阵运算-放缩,乘法和转置矩阵

    本期教程主要讲解矩阵运算中的放缩,乘法和转置。

    22.1 初学者重要提示

    22.2 DSP基础运算指令

    22.3 矩阵放缩(MatScale)

    22.4 矩阵乘法(MatMult)

    22.5 转置矩阵(MatTrans)

    22.6 实验例程说明(MDK)

    22.7 实验例程说明(IAR)

    22.8 总结

     

    22.1 初学者重要提示

    1.   ARM提供的DSP库逆矩阵求法有局限性,通过Matlab验证是可以求逆矩阵的,而DSP库却不能正确求解。
    2.   注意定点数的矩阵乘法运算中溢出问题。

    22.2 DSP基础运算指令

    本章用到的DSP指令在前面章节都已经讲解过。

    22.3 矩阵放缩(MatScale)

    以3*3矩阵为例,矩阵放缩的实现公式如下:

     

    22.3.1 函数arm_mat_scale_f32

    函数原型:

    arm_status arm_mat_scale_f32(

      const arm_matrix_instance_f32 * pSrc,

            float32_t                 scale,

            arm_matrix_instance_f32 * pDst)

    函数描述:

    这个函数用于浮点格式的矩阵数据的放缩。

    函数参数:

    •   第1个参数是源矩阵地址。
    •   第2个参数是放缩系数。
    •   第3个参数是放缩后的目的数据地址。
    •   返回值,ARM_MATH_SIZE_MISMATCH表示源矩阵和目标矩阵行列不一致,ARM_MATH_SUCCESS表示成功。

    注意事项:

    矩阵在数组中的存储是从左到右,再从上到下。

    22.3.2 函数arm_mat_scale_q31

    函数原型:

    arm_status arm_mat_scale_q31(

      const arm_matrix_instance_q31 * pSrc,

            q31_t                     scaleFract,

            int32_t                   shift,

            arm_matrix_instance_q31 * pDst)

    函数描述:

    这个函数用于定点Q31格式的矩阵数据的放缩。

    函数参数:

    •   第1个参数是源矩阵地址。
    •   第2个参数是放缩系数。
    •   第3个参数是移位的bit数。
    •   第4个参数是放缩后的目的数据地址。
    •   返回值,ARM_MATH_SIZE_MISMATCH表示源矩阵和目标矩阵行列不一致,ARM_MATH_SUCCESS表示成功。

    注意事项:

    1. 两个1.31格式的数据相乘产生2.62格式的数据,最终结果要做偏移和饱和运算产生1.31格式数。
    2. 定点数的最终放缩比例计算是:scale = scaleFract * 2^shift。
    3. 矩阵在数组中的存储是从左到右,再从上到下。

    22.3.3 函数arm_mat_scale_q15  

    函数原型:

    arm_status arm_mat_scale_q15(

      const arm_matrix_instance_q15 * pSrc,

            q15_t                     scaleFract,

            int32_t                   shift,

            arm_matrix_instance_q15 * pDst)

    函数描述:

    这个函数用于定点Q15格式的矩阵数据的放缩。

    函数参数:

    •   第1个参数是源矩阵地址。
    •   第2个参数是放缩系数。
    •   第3个参数是移位的bit数。
    •   第4个参数是放缩后的目的数据地址。
    •   返回值,ARM_MATH_SIZE_MISMATCH表示源矩阵和目标矩阵行列不一致,ARM_MATH_SUCCESS表示成功。

    注意事项:

    1. 两个1.15格式的数据相乘产生2.30格式的数据,最终结果要做偏移和饱和运算产生1.15格式数据。
    2. 定点数的最终放缩比例计算是:scale = scaleFract * 2^shift。
    3. 矩阵在数组中的存储是从左到右,再从上到下。

    22.3.4 使用举例(含matlab实现)

    程序设计:

    /*
    *********************************************************************************************************
    *    函 数 名: DSP_MatScale
    *    功能说明: 矩阵放缩
    *    形    参: 无
    *    返 回 值: 无
    *********************************************************************************************************
    */
    static void DSP_MatScale(void)
    {
        uint8_t i;
        
        /****浮点数数组******************************************************************/
        float32_t pDataA[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f};
        float32_t scale = 1.1f;
        float32_t pDataDst[9];
        
        arm_matrix_instance_f32 pSrcA; //3行3列数据
        arm_matrix_instance_f32 pDst;
        
        /****定点数Q31数组******************************************************************/
        q31_t pDataA1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};
        q31_t scaleFract = 10;
        int32_t shift = 0;
        q31_t pDataDst1[9];
        
        arm_matrix_instance_q31 pSrcA1; //3行3列数据
        arm_matrix_instance_q31 pDst1;
        
        /****定点数Q15数组******************************************************************/
        q15_t pDataA2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};
        q15_t scaleFract1 = 10;
        int32_t shift1 = 0;
        q15_t pDataDst2[9];
        
        arm_matrix_instance_q15 pSrcA2; //3行3列数据
        arm_matrix_instance_q15 pDst2;
        
        /****浮点数***********************************************************************/
        pSrcA.numCols = 3;
        pSrcA.numRows = 3;
        pSrcA.pData = pDataA;
    
        pDst.numCols = 3;
        pDst.numRows = 3;
        pDst.pData = pDataDst;
        
        printf("****浮点数******************************************
    ");
        arm_mat_scale_f32(&pSrcA, scale, &pDst);
        for(i = 0; i < 9; i++)
        {
            printf("pDataDst[%d] = %f
    ", i, pDataDst[i]);
        }
        
        /****定点数Q31***********************************************************************/
        pSrcA1.numCols = 3;
        pSrcA1.numRows = 3;
        pSrcA1.pData = pDataA1;
        
        pDst1.numCols = 3;
        pDst1.numRows = 3;
        pDst1.pData = pDataDst1;
        
        printf("****定点数Q31******************************************
    ");
        arm_mat_scale_q31(&pSrcA1, scaleFract, shift, &pDst1);
        for(i = 0; i < 9; i++)
        {
            printf("pDataDst1[%d] = %d
    ", i, pDataDst1[i]);
        }
        
        /****定点数Q15***********************************************************************/
        pSrcA2.numCols = 3;
        pSrcA2.numRows = 3;
        pSrcA2.pData = pDataA2;
        
        pDst2.numCols = 3;
        pDst2.numRows = 3;
        pDst2.pData = pDataDst2;
        
        printf("****定点数Q15******************************************
    ");
        arm_mat_scale_q15(&pSrcA2, scaleFract1, shift1, &pDst2);
        for(i = 0; i < 9; i++)
        {
            printf("pDataDst2[%d] = %d
    ", i, pDataDst2[i]);
        }
    }

    实验现象(按下K1按键后串口打印):

     

    下面通过matlab来实现矩阵的放缩:

     

    22.4 矩阵乘法(MatMult)

    以3*3矩阵为例,矩阵乘法的实现公式如下:

     

    22.4.1 函数arm_mat_mult_f32

    函数原型:

    arm_status arm_mat_mult_f32(

      const arm_matrix_instance_f32 * pSrcA,

      const arm_matrix_instance_f32 * pSrcB,

            arm_matrix_instance_f32 * pDst)

    函数描述:

    这个函数用于浮点数的矩阵乘法。

    函数参数:

    •   第1个参数是矩阵A的源地址。
    •   第2个参数是矩阵B的源地址。
    •   第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
    •   返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

    注意事项:

    1. 两个矩阵M x N和N x P相乘的结果是M x P(必须保证一个矩形的列数等于另一个矩阵的行数)。
    2. 矩阵在数组中的存储是从左到右,再从上到下。

    22.4.2 函数arm_mat_mult_q31

    函数原型:

    arm_status arm_mat_mult_q31(

      const arm_matrix_instance_q31 * pSrcA,

      const arm_matrix_instance_q31 * pSrcB,

            arm_matrix_instance_q31 * pDst)

    函数描述:

    这个函数用于定点数Q31的矩阵乘法。

    函数参数:

    •   第1个参数是矩阵A的源地址。
    •   第2个参数是矩阵B的源地址。
    •   第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
    •   返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

    注意事项:

    1. 两个1.31格式的数据相乘产生2.62格式的数据,函数的内部使用了64位的累加器,最终结果要做偏移和饱和运算产生1.31格式数据。
    2. 两个矩阵M x N和N x P相乘的结果是M x P.(必须保证一个矩形的列数等于另一个矩阵的行数)。
    3. 矩阵在数组中的存储是从左到右,再从上到下。

    22.4.3 函数arm_mat_mult_q15

    函数原型:

    arm_status arm_mat_mult_q15(

      const arm_matrix_instance_q15 * pSrcA,

      const arm_matrix_instance_q15 * pSrcB,

            arm_matrix_instance_q15 * pDst,

            q15_t                   * pState)

    函数描述:

    这个函数用于定点数Q15的矩阵乘法。

    函数参数:

    •   第1个参数是矩阵A的源地址。
    •   第2个参数是矩阵B的源地址。
    •   第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
    •   第4个参数用于存储内部计算结果。
    •   返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

    注意事项:

    1. 两个1.15格式数据相乘是2.30格式,函数的内部使用了64位的累加器,34.30格式,最终结果将低15位截取掉并做饱和处理为1.15格式。
    2. 两个矩阵M x N和N x P相乘的结果是M x P.(必须保证一个矩形的列数等于另一个矩阵的行数)。
    3. 矩阵在数组中的存储是从左到右,再从上到下。

    22.4.4 函数arm_mat_mult_fast_q31

    函数原型:

    arm_status arm_mat_mult_fast_q31(

      const arm_matrix_instance_q31 * pSrcA,

      const arm_matrix_instance_q31 * pSrcB,

            arm_matrix_instance_q31 * pDst)

    函数描述:

    这个函数用于定点数Q31的矩阵乘法。

    函数参数:

    •   第1个参数是矩阵A的源地址。
    •   第2个参数是矩阵B的源地址。
    •   第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
    •   返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

    注意事项:

    1. 两个1.31格式的数据相乘产生2.62格式的数据,函数的内部使用了64位的累加器,最终结果要做偏移和饱和运算产生1.31格式数据。
    2. 两个矩阵M x N和N x P相乘的结果是M x P.(必须保证一个矩形的列数等于另一个矩阵的行数)。
    3. 矩阵在数组中的存储是从左到右,再从上到下。
    4. 函数arm_mat_mult_fast_q31是arm_mat_mult_q31的快速算法。

    22.4.5 函数arm_mat_mult_fast_q15

    函数原型:

    arm_status arm_mat_mult_q15(

      const arm_matrix_instance_q15 * pSrcA,

      const arm_matrix_instance_q15 * pSrcB,

            arm_matrix_instance_q15 * pDst,

            q15_t                   * pState)

    函数描述:

    这个函数用于定点数Q15的矩阵乘法。

    函数参数:

    •   第1个参数是矩阵A的源地址。
    •   第2个参数是矩阵B的源地址。
    •   第3个参数是矩阵A乘以矩阵B计算结果存储的地址。
    •   第4个参数用于存储内部计算结果。
    •   返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

    注意事项:

    1. 两个1.15格式数据相乘是2.30格式,函数的内部使用了64位的累加器,34.30格式,最终结果将低15位截取掉并做饱和处理为1.15格式。
    2. 两个矩阵M x N和N x P相乘的结果是M x P.(必须保证一个矩形的列数等于另一个矩阵的行数)。
    3. 矩阵在数组中的存储是从左到右,再从上到下。

    22.4.6 使用举例(含matlab实现)

    程序设计:

    /*
    *********************************************************************************************************
    *    函 数 名: DSP_MatMult
    *    功能说明: 矩阵乘法
    *    形    参: 无
    *    返 回 值: 无
    *********************************************************************************************************
    */
    static void DSP_MatMult(void)
    {
        uint8_t i;
        
        /****浮点数数组******************************************************************/
        float32_t pDataA[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f};
        float32_t pDataB[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f};
        float32_t pDataDst[9];
        
        arm_matrix_instance_f32 pSrcA; //3行3列数据
        arm_matrix_instance_f32 pSrcB; //3行3列数据
        arm_matrix_instance_f32 pDst;
        
        /****定点数Q31数组******************************************************************/
        q31_t pDataA1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};
        q31_t pDataB1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};
        q31_t pDataDst1[9];
        
        arm_matrix_instance_q31 pSrcA1; //3行3列数据
        arm_matrix_instance_q31 pSrcB1; //3行3列数据
        arm_matrix_instance_q31 pDst1;
        
        /****定点数Q15数组******************************************************************/
        q15_t pDataA2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};
        q15_t pDataB2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};
        q15_t pDataDst2[9];
        
        arm_matrix_instance_q15 pSrcA2; //3行3列数据
        arm_matrix_instance_q15 pSrcB2; //3行3列数据
        arm_matrix_instance_q15 pDst2;
        q15_t pState[9];
        
        /****浮点数***********************************************************************/
        pSrcA.numCols = 3;
        pSrcA.numRows = 3;
        pSrcA.pData = pDataA;
        
        pSrcB.numCols = 3;
        pSrcB.numRows = 3;
        pSrcB.pData = pDataB;
        
        pDst.numCols = 3;
        pDst.numRows = 3;
        pDst.pData = pDataDst;
        
        printf("****浮点数******************************************
    ");
        arm_mat_mult_f32(&pSrcA, &pSrcB, &pDst);
        for(i = 0; i < 9; i++)
        {
            printf("pDataDst[%d] = %f
    ", i, pDataDst[i]);
        }
        
        /****定点数Q31***********************************************************************/
        pSrcA1.numCols = 3;
        pSrcA1.numRows = 3;
        pSrcA1.pData = pDataA1;
        
        pSrcB1.numCols = 3;
        pSrcB1.numRows = 3;
        pSrcB1.pData = pDataB1;
        
        pDst1.numCols = 3;
        pDst1.numRows = 3;
        pDst1.pData = pDataDst1;
        
        printf("****定点数Q31******************************************
    ");
        arm_mat_mult_q31(&pSrcA1, &pSrcB1, &pDst1);
        arm_mat_mult_fast_q31(&pSrcA1, &pSrcB1, &pDst1);
        for(i = 0; i < 9; i++)
        {
            printf("pDataDst1[%d] = %d
    ", i, pDataDst1[i]);
        }
        
        /****定点数Q15***********************************************************************/
        pSrcA2.numCols = 3;
        pSrcA2.numRows = 3;
        pSrcA2.pData = pDataA2;
        
        pSrcB2.numCols = 3;
        pSrcB2.numRows = 3;
        pSrcB2.pData = pDataB2;
        
        pDst2.numCols = 3;
        pDst2.numRows = 3;
        pDst2.pData = pDataDst2;
        
        printf("****定点数Q15******************************************
    ");
        
        arm_mat_mult_q15(&pSrcA2, &pSrcB2, &pDst2, pState);
        arm_mat_mult_fast_q15(&pSrcA2, &pSrcB2, &pDst2, pState);
        for(i = 0; i < 9; i++)
        {
            printf("pDataDst2[%d] = %d
    ", i, pDataDst2[i]);
        }
    }

    实验现象(按下K2按键后串口打印):

     

    下面通过matlab来实现矩阵的放缩:

     

    22.5 转置矩阵 MatTrans

    以3*3矩阵为例,转置矩阵的实现公式如下:

     

    22.5.1 函数arm_mat_trans_f32

    函数原型:

    arm_status arm_mat_trans_f32(

      const arm_matrix_instance_f32 * pSrc,

            arm_matrix_instance_f32 * pDst)

    函数描述:

    这个函数用于浮点数的转置矩阵求解。

    函数参数:

    •   第1个参数是矩阵源地址。
    •   第2个参数是转置后的矩阵地址。
    •   返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

    注意事项:

    1. 矩阵M x N转置后是N x M。也就是说pSrc源地址存储的矩阵是M x N格式的话,那么pDst地址必须是N x M格式。

    22.5.2 函数arm_mat_trans_q31

    函数原型:

    arm_status arm_mat_trans_q31(

      const arm_matrix_instance_q31 * pSrc,

            arm_matrix_instance_q31 * pDst)

    函数描述:

    这个函数用于定点数Q31的转置矩阵求解。

    函数参数:

    •   第1个参数是矩阵源地址。
    •   第2个参数是转置后的矩阵地址。
    •   返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

    注意事项:

    矩阵M x N转置后是N x M。也就是说pSrc源地址存储的矩阵是M x N格式的话,那么pDst地址必须是N x M格式。

    22.5.3 函数arm_mat_trans_q15

    函数原型:

    arm_status arm_mat_trans_q15(

      const arm_matrix_instance_q15 * pSrc,

            arm_matrix_instance_q15 * pDst)

    函数描述:

    这个函数用于定点数Q15的转置矩阵求解。

    函数参数:

    •   第1个参数是矩阵源地址。
    •   第2个参数是转置后的矩阵地址。
    •   返回值,ARM_MATH_SUCCESS表示成功,ARM_MATH_SIZE_MISMATCH表示矩阵大小不一致。

    注意事项:

    矩阵M x N转置后是N x M。也就是说pSrc源地址存储的矩阵是M x N格式的话,那么pDst地址必须是N x M格式。

    22.5.4 使用举例(含matlab实现)

    程序设计:

    /*
    *********************************************************************************************************
    *    函 数 名: DSP_MatScale
    *    功能说明: 矩阵放缩
    *    形    参: 无
    *    返 回 值: 无
    *********************************************************************************************************
    */
    static void DSP_MatScale(void)
    {
        uint8_t i;
        
        /****浮点数数组******************************************************************/
        float32_t pDataA[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f};
        float32_t scale = 1.1f;
        float32_t pDataDst[9];
        
        arm_matrix_instance_f32 pSrcA; //3行3列数据
        arm_matrix_instance_f32 pDst;
        
        /****定点数Q31数组******************************************************************/
        q31_t pDataA1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};
        q31_t scaleFract = 10;
        int32_t shift = 0;
        q31_t pDataDst1[9];
        
        arm_matrix_instance_q31 pSrcA1; //3行3列数据
        arm_matrix_instance_q31 pDst1;
        
        /****定点数Q15数组******************************************************************/
        q15_t pDataA2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};
        q15_t scaleFract1 = 10;
        int32_t shift1 = 0;
        q15_t pDataDst2[9];
        
        arm_matrix_instance_q15 pSrcA2; //3行3列数据
        arm_matrix_instance_q15 pDst2;
        
        /****浮点数***********************************************************************/
        pSrcA.numCols = 3;
        pSrcA.numRows = 3;
        pSrcA.pData = pDataA;
    
        pDst.numCols = 3;
        pDst.numRows = 3;
        pDst.pData = pDataDst;
        
        printf("****浮点数******************************************
    ");
        arm_mat_scale_f32(&pSrcA, scale, &pDst);
        for(i = 0; i < 9; i++)
        {
            printf("pDataDst[%d] = %f
    ", i, pDataDst[i]);
        }
        
        /****定点数Q31***********************************************************************/
        pSrcA1.numCols = 3;
        pSrcA1.numRows = 3;
        pSrcA1.pData = pDataA1;
        
        pDst1.numCols = 3;
        pDst1.numRows = 3;
        pDst1.pData = pDataDst1;
        
        printf("****定点数Q31******************************************
    ");
        arm_mat_scale_q31(&pSrcA1, scaleFract, shift, &pDst1);
        for(i = 0; i < 9; i++)
        {
            printf("pDataDst1[%d] = %d
    ", i, pDataDst1[i]);
        }
        
        /****定点数Q15***********************************************************************/
        pSrcA2.numCols = 3;
        pSrcA2.numRows = 3;
        pSrcA2.pData = pDataA2;
        
        pDst2.numCols = 3;
        pDst2.numRows = 3;
        pDst2.pData = pDataDst2;
        
        printf("****定点数Q15******************************************
    ");
        arm_mat_scale_q15(&pSrcA2, scaleFract1, shift1, &pDst2);
        for(i = 0; i < 9; i++)
        {
            printf("pDataDst2[%d] = %d
    ", i, pDataDst2[i]);
        }
    }
    
    
    /*
    *********************************************************************************************************
    *    函 数 名: DSP_MatTrans
    *    功能说明: 矩阵数据初始化
    *    形    参: 无
    *    返 回 值: 无
    *********************************************************************************************************
    */
    static void DSP_MatTrans(void)
    {
        uint8_t i;
    
        /****浮点数数组******************************************************************/
        float32_t pDataA[9] = {1.1f, 1.1f, 2.1f, 2.1f, 3.1f, 3.1f, 4.1f, 4.1f, 5.1f};
        float32_t pDataDst[9];
        
        arm_matrix_instance_f32 pSrcA; //3行3列数据
        arm_matrix_instance_f32 pDst;
        
        /****定点数Q31数组******************************************************************/
        q31_t pDataA1[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};
        q31_t pDataDst1[9];
        
        arm_matrix_instance_q31 pSrcA1; //3行3列数据
        arm_matrix_instance_q31 pDst1;
        
        /****定点数Q15数组******************************************************************/
        q15_t pDataA2[9] = {1, 1, 2, 2, 3, 3, 4, 4, 5};
        q15_t pDataDst2[9];
        
        arm_matrix_instance_q15 pSrcA2; //3行3列数据
        arm_matrix_instance_q15 pDst2;
        
        /****浮点数***********************************************************************/
        pSrcA.numCols = 3;
        pSrcA.numRows = 3;
        pSrcA.pData = pDataA;
    
        pDst.numCols = 3;
        pDst.numRows = 3;
        pDst.pData = pDataDst;
        
        printf("****浮点数******************************************
    ");
        arm_mat_trans_f32(&pSrcA, &pDst);
        for(i = 0; i < 9; i++)
        {
            printf("pDataDst[%d] = %f
    ", i, pDataDst[i]);
        }
        
        /****定点数Q31***********************************************************************/
        pSrcA1.numCols = 3;
        pSrcA1.numRows = 3;
        pSrcA1.pData = pDataA1;
        
        pDst1.numCols = 3;
        pDst1.numRows = 3;
        pDst1.pData = pDataDst1;
        
        printf("****定点数Q31******************************************
    ");
        arm_mat_trans_q31(&pSrcA1, &pDst1);
        for(i = 0; i < 9; i++)
        {
            printf("pDataDst1[%d] = %d
    ", i, pDataDst1[i]);
        }
        
        /****定点数Q15***********************************************************************/
        pSrcA2.numCols = 3;
        pSrcA2.numRows = 3;
        pSrcA2.pData = pDataA2;
        
        pDst2.numCols = 3;
        pDst2.numRows = 3;
        pDst2.pData = pDataDst2;
        
        printf("****定点数Q15******************************************
    ");
        arm_mat_trans_q15(&pSrcA2, &pDst2);
        for(i = 0; i < 9; i++)
        {
            printf("pDataDst2[%d] = %d
    ", i, pDataDst2[i]);
        }
    }

    实验现象(按下K3按键后串口打印):

     

    下面通过matlab来实现矩阵的放缩:

     

    22.6 实验例程说明(MDK)

    配套例子:

    V6-217_DSP矩阵运算(放缩,乘法和转置)

    实验目的:

    1. 学习DSP复数运算(放缩,乘法和转置)

    实验内容:

    1. 启动一个自动重装软件定时器,每100ms翻转一次LED2。
    2. 按下按键K1,串口打函数DSP_MatScale的输出数据。
    3. 按下按键K2,串口打函数DSP_MatMult的输出数据。
    4. 按下按键K3,串口打函数DSP_MatTrans的输出数据。

    使用AC6注意事项

    特别注意附件章节C的问题

    上电后串口打印的信息:

    波特率 115200,数据位 8,奇偶校验位无,停止位 1。

    详见本章的3.4 ,4.6和5.4小节。

    程序设计:

      系统栈大小分配:

     

      硬件外设初始化

    硬件外设的初始化是在 bsp.c 文件实现:

    /*
    *********************************************************************************************************
    *    函 数 名: bsp_Init
    *    功能说明: 初始化所有的硬件设备。该函数配置CPU寄存器和外设的寄存器并初始化一些全局变量。只需要调用一次
    *    形    参:无
    *    返 回 值: 无
    *********************************************************************************************************
    */
    void bsp_Init(void)
    {
        /* 
           STM32F407 HAL 库初始化,此时系统用的还是F407自带的16MHz,HSI时钟:
           - 调用函数HAL_InitTick,初始化滴答时钟中断1ms。
           - 设置NVIV优先级分组为4。
         */
        HAL_Init();
    
        /* 
           配置系统时钟到168MHz
           - 切换使用HSE。
           - 此函数会更新全局变量SystemCoreClock,并重新配置HAL_InitTick。
        */
        SystemClock_Config();
    
        /* 
           Event Recorder:
           - 可用于代码执行时间测量,MDK5.25及其以上版本才支持,IAR不支持。
           - 默认不开启,如果要使能此选项,务必看V5开发板用户手册第8章
        */    
    #if Enable_EventRecorder == 1  
        /* 初始化EventRecorder并开启 */
        EventRecorderInitialize(EventRecordAll, 1U);
        EventRecorderStart();
    #endif
        
        bsp_InitKey();        /* 按键初始化,要放在滴答定时器之前,因为按钮检测是通过滴答定时器扫描 */
        bsp_InitTimer();      /* 初始化滴答定时器 */
        bsp_InitUart();    /* 初始化串口 */
        bsp_InitExtIO();   /* 初始化扩展IO */
        bsp_InitLed();        /* 初始化LED */        
    }

      主功能:

    主程序实现如下操作:

    •   启动一个自动重装软件定时器,每100ms翻转一次LED2。
    •   按下按键K1,串口打函数DSP_MatScale的输出数据。
    •   按下按键K2,串口打函数DSP_MatMult的输出数据。
    •   按下按键K3,串口打函数DSP_MatTrans的输出数据。
    /*
    *********************************************************************************************************
    *    函 数 名: main
    *    功能说明: c程序入口
    *    形    参: 无
    *    返 回 值: 错误代码(无需处理)
    *********************************************************************************************************
    */
    int main(void)
    {
        uint8_t ucKeyCode;        /* 按键代码 */
        
    
        bsp_Init();        /* 硬件初始化 */
        PrintfLogo();    /* 打印例程信息到串口1 */
    
        PrintfHelp();    /* 打印操作提示信息 */
        
    
        bsp_StartAutoTimer(0, 100);    /* 启动1个100ms的自动重装的定时器 */
    
        /* 进入主程序循环体 */
        while (1)
        {
            bsp_Idle();        /* 这个函数在bsp.c文件。用户可以修改这个函数实现CPU休眠和喂狗 */
    
            /* 判断定时器超时时间 */
            if (bsp_CheckTimer(0))    
            {
                /* 每隔100ms 进来一次 */  
                bsp_LedToggle(2);
            }
            
            ucKeyCode = bsp_GetKey();    /* 读取键值, 无键按下时返回 KEY_NONE = 0 */
            if (ucKeyCode != KEY_NONE)
            {
                switch (ucKeyCode)
                {
                    case KEY_DOWN_K1:            /* 按下按键K1,串口打函数DSP_MatScale的输出数据 */
                        DSP_MatScale();
                        break;
                        
                    case KEY_DOWN_K2:            /* 按下按键K2,串口打函数DSP_MatMult的输出数据 */
                        DSP_MatMult();
                        break;
    
                    case KEY_DOWN_K3:            /* 按下按键K3,串口打函数DSP_MatTrans的输出数据 */
                        DSP_MatTrans();
                        break;
    
                    default:
                        /* 其他的键值不处理 */
                        break;
                }
            }
        }
    }

    22.7 实验例程说明(IAR)

    配套例子:

    V6-217_DSP矩阵运算(放缩,乘法和转置)

    实验目的:

    1. 学习DSP复数运算(放缩,乘法和转置)

    实验内容:

    1. 启动一个自动重装软件定时器,每100ms翻转一次LED2。
    2. 按下按键K1,串口打函数DSP_MatScale的输出数据。
    3. 按下按键K2,串口打函数DSP_MatMult的输出数据。
    4. 按下按键K3,串口打函数DSP_MatTrans的输出数据。

    上电后串口打印的信息:

    波特率 115200,数据位 8,奇偶校验位无,停止位 1。

    详见本章的3.4 ,4.6和5.4小节。

    程序设计:

      系统栈大小分配:

     

      硬件外设初始化

    硬件外设的初始化是在 bsp.c 文件实现:

    /*
    *********************************************************************************************************
    *    函 数 名: bsp_Init
    *    功能说明: 初始化所有的硬件设备。该函数配置CPU寄存器和外设的寄存器并初始化一些全局变量。只需要调用一次
    *    形    参:无
    *    返 回 值: 无
    *********************************************************************************************************
    */
    void bsp_Init(void)
    {
        /* 
           STM32F407 HAL 库初始化,此时系统用的还是F407自带的16MHz,HSI时钟:
           - 调用函数HAL_InitTick,初始化滴答时钟中断1ms。
           - 设置NVIV优先级分组为4。
         */
        HAL_Init();
    
        /* 
           配置系统时钟到168MHz
           - 切换使用HSE。
           - 此函数会更新全局变量SystemCoreClock,并重新配置HAL_InitTick。
        */
        SystemClock_Config();
    
        /* 
           Event Recorder:
           - 可用于代码执行时间测量,MDK5.25及其以上版本才支持,IAR不支持。
           - 默认不开启,如果要使能此选项,务必看V5开发板用户手册第8章
        */    
    #if Enable_EventRecorder == 1  
        /* 初始化EventRecorder并开启 */
        EventRecorderInitialize(EventRecordAll, 1U);
        EventRecorderStart();
    #endif
        
        bsp_InitKey();        /* 按键初始化,要放在滴答定时器之前,因为按钮检测是通过滴答定时器扫描 */
        bsp_InitTimer();      /* 初始化滴答定时器 */
        bsp_InitUart();    /* 初始化串口 */
        bsp_InitExtIO();   /* 初始化扩展IO */
        bsp_InitLed();        /* 初始化LED */        
    }

      主功能:

    主程序实现如下操作:

    •   启动一个自动重装软件定时器,每100ms翻转一次LED2。
    •   按下按键K1,串口打函数DSP_MatScale的输出数据。
    •   按下按键K2,串口打函数DSP_MatMult的输出数据。
    •   按下按键K3,串口打函数DSP_MatTrans的输出数据。
    /*
    *********************************************************************************************************
    *    函 数 名: main
    *    功能说明: c程序入口
    *    形    参: 无
    *    返 回 值: 错误代码(无需处理)
    *********************************************************************************************************
    */
    int main(void)
    {
        uint8_t ucKeyCode;        /* 按键代码 */
        
    
        bsp_Init();        /* 硬件初始化 */
        PrintfLogo();    /* 打印例程信息到串口1 */
    
        PrintfHelp();    /* 打印操作提示信息 */
        
    
        bsp_StartAutoTimer(0, 100);    /* 启动1个100ms的自动重装的定时器 */
    
        /* 进入主程序循环体 */
        while (1)
        {
            bsp_Idle();        /* 这个函数在bsp.c文件。用户可以修改这个函数实现CPU休眠和喂狗 */
    
            /* 判断定时器超时时间 */
            if (bsp_CheckTimer(0))    
            {
                /* 每隔100ms 进来一次 */  
                bsp_LedToggle(2);
            }
            
            ucKeyCode = bsp_GetKey();    /* 读取键值, 无键按下时返回 KEY_NONE = 0 */
            if (ucKeyCode != KEY_NONE)
            {
                switch (ucKeyCode)
                {
                    case KEY_DOWN_K1:            /* 按下按键K1,串口打函数DSP_MatScale的输出数据 */
                        DSP_MatScale();
                        break;
                        
                    case KEY_DOWN_K2:            /* 按下按键K2,串口打函数DSP_MatMult的输出数据 */
                        DSP_MatMult();
                        break;
    
                    case KEY_DOWN_K3:            /* 按下按键K3,串口打函数DSP_MatTrans的输出数据 */
                        DSP_MatTrans();
                        break;
    
                    default:
                        /* 其他的键值不处理 */
                        break;
                }
            }
        }
    }

    22.8 总结

    本期教程就跟大家讲这么多,有兴趣的可以深入研究下算法的具体实现。

  • 相关阅读:
    spring boot的actuator
    mongo的用户角色配置
    spring boot使用AOP统一处理web请求
    (原)luarocks install 提示 failed fetching manifest
    (原)ubuntu中安装kate
    (原+转)Ubuntu16.04软件中心闪退及wifi消失
    (原)torch使用caffe时,提示CUDNN_STATUS_EXECUTION_FAILED
    (原)torch中微调某层参数
    (原)torch的apply函数
    (原)torch的训练过程
  • 原文地址:https://www.cnblogs.com/armfly/p/12880458.html
Copyright © 2011-2022 走看看