矩阵乘法的顺序安排问题
问题背景
设矩阵 A、B 大小分别 (p imes q) , (q imes r) ,则矩阵乘积 AB 需要做的标量乘法次数为 (p imes q imes r) 。我们知道矩阵的乘法运算是不可交换的,但它是可结合的。因此对于多个矩阵的连乘,我们可以以任意顺序添加括号改变其中相邻矩阵乘法的优先级。不同计算顺序下总的标量乘法运算次数是不同的,我们的目标是找到一个最优的矩阵乘法计算顺序。
给定矩阵乘法序列 (A_1, A_2, ..., A_n),将乘法序列以第 (i) 个矩阵分为前后两部分,则方案数为前后两部分方案数之积。因此乘法计算的顺序个数为
T(n) 的解为 Catalan数,这里不加证明给出结果为
由此可见的矩阵乘法顺序个数为问题规模 (n) 的指数级,显然通过枚举找到最优的乘法顺序是不合适的。
暴力算法
首先还是试探一下如何用最朴素的方式解决。
设 (M_{i, j}) 表示 第 (i) 个矩阵到第 (j) 个矩阵的最少乘法运算次数,用数学化的语言表达我们的目标,即
其中 p、q、r为最后两个矩阵的大小。
代码很容易实现:
def minMatrixMultiplication(Mats):
"""
:param Mats: Mat类型的list
:return: 矩阵乘法的最小乘法次数,及对应的括号位置
"""
if len(Mats)==1:
return 0, '[%d,%d]' % (Mats[0].n, Mats[0].m)
import math
minCost = math.inf
bestSeq = '' # 记录添加的括号位置
for i in range(0, len(Mats)-1):
leftCost, leftSeq = minMatrixMultiplication(Mats[:i+1])
rightCost, rightSeq = minMatrixMultiplication(Mats[i+1:])
tmpCost = leftCost + rightCost + Mats[0].n * Mats[i].m * Mats[-1].m
if tmpCost < minCost:
minCost = tmpCost
bestSeq = '(' + leftSeq + '*' + rightSeq + ')'
return minCost, bestSeq
测试用的矩阵类型Mat定义如下:
class Mat:
def __init__(self, mat=None):
if mat and isinstance(mat[0], list):
self.mat = mat
self.n = len(mat)
self.m = len(mat[0])
else:
self.mat = [[]]
self.n = 0
self.m = 0
def __init__(self, n, m):
self.mat = [[]]
self.n = n
self.m = m
以上算法的函数调用次数 (f(n) = 1 + f(1)+f(n-1) + f(2)+f(n-2) + ... + f(n-1)+f(1)),
容易验证得到(f(n) = 3^n), 即该算法的复杂度为 O((3^n)),这是不可接受的。
记忆化
分析一番可以发现,对于矩阵序列 i~j 之间乘法的最优结果 (M_{i, j}) 只有 ( ext{C}_n^2) 种,那么上述代码的中间很多段都进行了重复计算。如果把中间得到的答案记录下来,可以大大减少计算量。
在不改变上述算法的框架下,将 i~j 之间的结果 (M_{i, j}) 定义Python嵌套的内部函数。新增了变量 invokeCnt
统计递归函数需要重新计算 (M_{i, j}) 的次数。
def minMatrixMultiplication2(Mats):
siz = len(Mats) + 1
# 血的教训:不要使用下面的方法定义二维数组
# minCostMem = [[-1]*siz]*siz
# bestSeqMem = [['']*siz]*siz
minCostMem = [[-1]*siz for i in range(siz)]
bestSeqMem = [['']*siz for i in range(siz)]
invokeCnt = 0 # 统计递归函数重新执行次数
def helper(s, t):
if s==t:
return 0, '[%d,%d]' % (Mats[s].n, Mats[s].m)
if minCostMem[s][t]!=-1:
return minCostMem[s][t], bestSeqMem[s][t]
nonlocal invokeCnt
invokeCnt += 1
import math
minCost = math.inf
bestSeq = ''
for i in range(s, t):
leftCost, leftSeq = helper(s, i)
rightCost, rightSeq = helper(i+1, t)
tmpCost = leftCost + rightCost + Mats[s].n * Mats[i].m * Mats[t].m
if tmpCost < minCost:
minCost = tmpCost
bestSeq = '(' + leftSeq + '*' + rightSeq + ')'
minCostMem[s][t] = minCost
bestSeqMem[s][t] = bestSeq
return minCost, bestSeq
return helper(0, len(Mats)-1), invokeCnt
动态规划
(待补充。。。)
运行对比
Mats = [Mat(2,3), Mat(3,5), Mat(5,8), Mat(8,2), Mat(2,3), Mat(3,2), Mat(2,5), Mat(5, 3)]
print(minMatrixMultiplication(Mats))
# (184, '((([2,3]*([3,5]*([5,8]*[8,2])))*([2,3]*[3,2]))*([2,5]*[5,3]))')
# 调用次数 3^8 = 2187
print(minMatrixMultiplication2(Mats))
# ((184, '((([2,3]*([3,5]*([5,8]*[8,2])))*([2,3]*[3,2]))*([2,5]*[5,3]))'), 28)
注意事项
Python 定义二维矩阵,千万不要使用注释写法。调试了很久才发现问题。 T^T
正确的写法为
- matrix = [[0]*m for i in range(n)]
- 或使用numpy库
import numpy
matrix = numpy.zeros((n, m))
原因可以简单理解为
n = 5
m = 3
matrix = [[0]*m]*n
# 相当于
"""
array = [0 0 0]
matrix = [array]*5
# matrix内的5个元素都是同一个列表引用
# 当使用 matrix[3][2] = 1 赋值
# 则 array[2] = 1
# 所以 matrix[0~4][2]都为 1
"""