zoukankan      html  css  js  c++  java
  • 算法分析与设计——矩阵连乘问题

    问题描述

      给定n个矩阵:A1,A2,...,An,其中Ai与Ai+1是可乘的,i=1,2...,n-1。确定计算矩阵连乘积的计算次序,使得依此次序计算矩阵连乘积需要的数乘次数最少。输入数据为矩阵个数和每个矩阵规模,输出结果为计算矩阵连乘积的计算次序和最少数乘次数。

     问题解析:

      由于矩阵乘法满足结合律,故计算矩阵的连乘积可以有许多不同的计算次序。这种计算次序可以用加括号的方式来确定。若一个矩阵连乘积的计算次序完全确定,也就是说该连乘积已完全加括号,则可以依此次序反复调用2个矩阵相乘的标准算法计算出矩阵连乘积。

           完全加括号的矩阵连乘积可递归地定义为:

         (1)单个矩阵是完全加括号的;

         (2)矩阵连乘积A是完全加括号的,则A可表示为2个完全加括号的矩阵连乘积B和C的乘积并加括号,即A=(BC)

           例如,矩阵连乘积A1A2A3A4有5种不同的完全加括号的方式:(A1(A2(A3A4))),(A1((A2A3)A4)),((A1A2)(A3A4)),((A1(A2A3))A4),(((A1A2)A3)A4)。每一种完全加括号的方式对应于一个矩阵连乘积的计算次序,这决定着作乘积所需要的计算量。

          看下面一个例子,计算三个矩阵连乘{A1,A2,A3};维数分别为10*100 , 100*5 , 5*50 按此顺序计算需要的次((A1*A2*A3):10X100X5+10X5X50=7500次,按此顺序计算需要的次数(A1*(A2*A3)):10*5*50+10*100*50=75000次

          所以问题是:如何确定运算顺序,可以使计算量达到最小化。      

     

    算法思路

          例:设要计算矩阵连乘乘积A1A2A3A4A5A6,其中各矩阵的维数分别是:

          A1:30*35;     A2:35*15;     A3:15*5;     A4:5*10;     A5:10*20;     A6:20*25 

     

          递推关系

          设计算A[i:j],1≤i≤j≤n,所需要的最少数乘次数m[i,j],则原问题的最优值为m[1,n]。

          当i=j时,A[i:j]=Ai,因此,m[i][i]=0,i=1,2,…,n
          当i<j时,若A[i:j]的最优次序在Ak和Ak+1之间断开,i<=k<j,则:m[i][j]=m[i][k]+m[k+1][j]+pi-1*pk*pj。由于在计算是并不知道断开点k的位置,所以k还未定。不过k的位置只有j-i个可能。因此,k是这j-i个位置使计算量达到最小的那个位置。

          综上,有递推关系如下:

              

      计算最优值:

         用动态规划算法解此问题时,可依据其递归式以自底向上的方式进行计算。在计算过程中,保存以解决的子问题的答案,每个子问题只计算一次,而在后面用到时只需要简单查一下,避免了大量的重复计算,最后得到了多项式时间的算法。

      代码如下:

     1 void matrixChain(int p[],int m[][],int s[][])
     2 //p用来记录矩阵,m[i][j]表示第i个矩阵到第j个矩阵的最优解,s[][]记录从哪里断开可以得到最优解
     3 {
     4     int n=len-1;
     5     for(int i=1; i<=n; i++)//初始化数组
     6         m[i][j]=0;
     7     for(int r=2; r<=n; r++)//对角线循环
     8     {
     9         for(int i=1; i<=n-r+1; i++) //行循环
    10         {
    11             int j=i+r-1;//列的控制
    12             m[i][j]=m[i+1][j]+p[i-1]*p[i]*p[j];//找m[i][j]的最小值,初始化使k=i;
    13             s[i][j]=i;
    14             for(int k=i+1; k<j; k++)
    15             {
    16                 int t=m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j];
    17                 if(t<m[i][j])
    18                 {
    19                     s[i][j]=k;//在k位置断开得到最优解
    20                     m[i][j]=t;
    21                 }
    22             }
    23         }
    24     }
    25 }

      
    构造最优解

          若将对应m[i][j]的断开位置k记为s[i][j],在计算出最优值m[i][j]后,可递归地由s[i][j]构造出相应的最优解。s[i][j]中的数表明,计算矩阵链A[i:j]的最佳方式应在矩阵Ak和Ak+1之间断开,即最优的加括号方式应为(A[i:k])(A[k+1:j)。因此,从s[1][n]记录的信息可知计算A[1:n]的最优加括号方式为(A[1:s[1][n]])(A[s[1][n]+1:n]),进一步递推,A[1:s[1][n]]的最优加括号方式为(A[1:s[1][s[1][n]]])(A[s[1][s[1][n]]+1:s[1][s[1][n]]])。同理可以确定A[s[1][n]+1:n]的最优加括号方式在s[s[1][n]+1][n]处断开...照此递推下去,最终可以确定A[1:n]的最优完全加括号方式,及构造出问题的一个最优解。

    代码如下:

    1 void traceback(int s[][],int i,int j)
    2 {
    3     if(i==j)
    4         retiurn;
    5     traceback(s,i,s[i][j]);
    6     traceback(s,s[i][j]+1,j);
    7     cout<<"Multiply A"<<i<<","<<s[i][j]<<"and A"<<s[i][j]+1<<","<<j<<endl;
    8 }

    完整代码如下:

     1 #include<stdio.h>
     2 #include<iostream>
     3 #include<algorithm>
     4 #include<stdlib.h>
     5 using namespace std;
     6 const int MAX = 100;
     7 int n;
     8 int p[MAX+1],m[MAX][MAX],s[MAX][MAX];
     9 //p用来记录矩阵,m[i][j]表示第i个矩阵到第j个矩阵的最优解,s[][]记录从哪里断开可以得到最优解
    10 void matrixChain()
    11 {
    12     for(int i=1; i<=n; i++)//初始化数组
    13         m[i][i]=0;
    14     for(int r=2; r<=n; r++)//对角线循环
    15     {
    16         for(int i=1; i<=n-r+1; i++) //行循环
    17         {
    18             int j=i+r-1;//列的控制
    19             m[i][j]=m[i+1][j]+p[i-1]*p[i]*p[j];//找m[i][j]的最小值,初始化使k=i;
    20             s[i][j]=i;
    21             for(int k=i+1; k<j; k++)
    22             {
    23                 int t=m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j];
    24                 if(t<m[i][j])
    25                 {
    26                     s[i][j]=k;//在k位置断开得到最优解
    27                     m[i][j]=t;
    28                 }
    29             }
    30         }
    31     }
    32 }
    33 void traceback(int i,int j)
    34 {
    35     if(i==j)
    36         return;
    37     traceback(i,s[i][j]);
    38     traceback(s[i][j]+1,j);
    39     cout<<"Multiply A"<<i<<","<<s[i][j]<<"and A"<<s[i][j]+1<<","<<j<<endl;
    40 }
    41 int main()
    42 {
    43     cin>>n;
    44     for(int i=0; i<=n; i++)
    45         cin>>p[i];
    46     matrixChain();
    47     traceback(1,n);
    48     cout<<m[1][n]<<endl;
    49     return 0;
    50 }

    输出结果如下:

  • 相关阅读:
    ① ts基础
    ⑦ 原型和原型链 作用域链
    ④ 小程序使用分包
    功能⑦ 小程序整合高德地图定位
    effective OC2.0 52阅读笔记(三 接口与API设计)
    effective OC2.0 52阅读笔记(二 对象、消息、运行期)
    effective OC2.0 52阅读笔记(一 熟悉Objective-C)
    perl的Getopt::Long和pod::usage ?
    安装你自己的perl modules
    Perl 之 use(), require(), do(), %INC and @INC
  • 原文地址:https://www.cnblogs.com/PJQOOO/p/4474354.html
Copyright © 2011-2022 走看看