zoukankan      html  css  js  c++  java
  • einsum 入门指南

    einsum 入门

    爱因斯坦求和(einsum),计算指定维度元素的乘积,再求和。可以将爱因斯坦求和记法理解为懒人求和记法,省略不写 (Sigma)。einsum 具有很强大的表达能力,使用 einsum 的表达式,可以表达各种各样的操作,比如矩阵乘法、矩阵转置。很多库都支持 einsum,有 numpy,pytorch,tensorflow。

    这篇文章分为三个部分。

    • 第一部分,从代码入手,直接上手 einsum,毕竟 einsum 是很直观的,聪明的你看一看代码就能理解。
    • 第二部分,介绍爱因斯坦求和(einsum),介绍表达式各个部分的含义。
    • 第三部分,给出几道练习题,有兴趣的读者可以思考一下如何用 einsum 表达。

    einsum 快速上手

    下面以 pytorch 为例子,介绍 einsum 的一些常见的用法。

    例1:矩阵乘法

    矩阵乘法中,每个元素由下面的表达式确定。

    [A_{ij} = Sigma_{k=1}^{n} B_{ik} C_{kj} ]

    第一个学习的 einsum 表达式是,ik,kj->ij。前面提到过,爱因斯坦求和记法可以理解为懒人求和记法。将上述公式中的 (Sigma) 去掉,并且将左右两边对调一下,省去矩阵之后,剩下的就是 ik,kj->ij 了。

    例2:对角线元素

    虽然 einsum 的名字当中有 sum,但是 einsum 可以不做求和。举个例子,获取二维方阵的对角线元素,结果放入一维向量。

    [A_i = B_{ii} ]

    上面,A 是一维向量,B 是二维方阵。使用 einsum 记法,可以写作 ii->i

    例3:迹(trace)

    观察一下,矩阵乘法和对角线元素两个表达式有什么区别。ik,kj->ijii->i

    • 矩阵乘法中,箭头左边有 k 而箭头右边没有。
    • 对角线元素中,左边和右边都只有 i
    • 矩阵乘法省略了 (Sigma),对角线元素没有省略 (Sigma)

    基于上面的观察,可以大致推测出来,左边出现但是右边没有出现的符号,这个符号省略了 (Sigma)

    接下来,我们来尝试一下求解矩阵的迹(trace),即对角线元素的和。

    [t = Sigma_{k=1}^{n} A_{kk} ]

    t 是常量,A 是二维方阵。按照前面的做法,省略 (Sigma),左右两边对调,省去矩阵和 t,剩下的就是 kk->

    对,你没有看错,右边没有东西。这意味着,左边的符号都省略了 (Sigma)

    例4:矩阵转置

    有了前面的基础,矩阵转置就很简单啦,写表达式。

    [A_{ij} = B_{ji} ]

    A 和 B 都是二维方阵。einsum 可以表达为 ij->ji

    在 pytorch 中,还支持省略前面的维度。比如,只转置最后两个维度,可以表达为 ...ij->...ji。下面展示了一个含有四个二维矩阵的三维矩阵,转置三维矩阵中的每个二维矩阵。

    einsum 表达式

    在快速上手了 einsum 之后,接下来考察一下 einsum,补充一些细节。

    pytorch 的文档写得非常清楚了:https://pytorch.org/docs/stable/generated/torch.einsum.html

    下面总结一下规则:

    • 表达式由输入和输出两部分组成。例子,ij->ji
    • 输出可以省略,箭头也可以省略。输入中仅出现一次的字符将按照字母序构成输出。例子,ba 完整的表达式是 ba->ab
    • 输入中多次出现的字符,将被用作求和。例子,kj,ji 完整的表达式是 kj,ji->ik,矩阵乘法再相乘。
    • 输出可以指定,但是输出中的每个字符必须在输入中出现至少一次,输出的每个字符在输出中只能出现最多一次。例子,ab->aa 是非法的,ab->c 是非法的,ab->a 是合法的。
    • 省略符 ... 是用来跳过部分维度。例子,...ij,...jk 表示 batch 矩阵乘法。
    • 在输出没有指定的情况下,省略符优先级高于普通字符。例子,b...a 完整的表达式是 b...a->...ab,可以将一个形状为 (a,b,c) 的矩阵变为形状为 (b,c,a) 的矩阵。
    • 允许多个矩阵输入,表达式中使用逗号分开不同矩阵输入的下标。例子,i,i,i 表示将三个一维向量按位相乘,并相加。
    • 除了箭头,其他任何地方都可以加空格。例子,i j , j k -> ik 是合法的,ij,jk - > ik 是非法的。
    • 输入的表达式,维度需要和输入的矩阵对上,不能多也不能少。比如一个 shape 为 (4,3,3) 的矩阵,表达式 ab->a 是非法的,abc-> 是合法的。

    练习

    练习1:向量内积

    练习2:向量外积

    练习3:矩阵按行求和

    练习4:矩阵按列求和

    练习5:转置最后两维

    总结

    上面简单介绍了 einsum 的用法,einsum 可以表达很多操作,比如矩阵乘法、矩阵转置。上面仅仅是做了简单的介绍,大家在炼丹的过程中,遇到过哪些让你直呼牛逼的 einsum 表达式呢?希望能得到你的分享,感谢!

  • 相关阅读:
    iOS 代码规范
    Clang Format
    PullToRefreshListView手动刷新问题
    android不依赖具体activity弹出Dialog对话框,即全局性对话框
    我的手机华为荣耀7,运行android程序不输出Log
    Android从imageview中获得bitmap
    Fragment里面的ViewPager嵌套subFragment,主Fragment切换的时候subFragment出现空白Fragment的Bug
    解决某些手机RadioGroup中的RadioButton不居中的问题
    Android权限大全
    UML类图
  • 原文地址:https://www.cnblogs.com/zzk0/p/14723925.html
Copyright © 2011-2022 走看看