转载:https://bbs.pinggu.org/thread-7078237-1-1.html
R语言中的outer()函数,名为内积函数,但是他执行的功能并不是解析几何中的内积。那该函数到底发挥什么功能呢?
我们将分三个部分来探究该函数,其一是outer()函数的传入参数,其二是outer()函数的运算步骤,其三是拓展举例。
1.outer()函数的传入参数
函数格式:outer(x,y,paste或"operator")
1)x和y
x和y可以是向量(vextor)、矩阵(matrix)、数组(array)、数据框(frame)、列表(list)
注:a.此处向量均指列向量
b.常用类型为数值型、字符型、逻辑型。
c.相同类型的向量:v1<-c(1,2,3),v2<-c(4,5,6),则v1和v2为相同类型的向量。而v1<-c(1,2,3),v2<-c("A","B","C"),则v1和v2为不同类型的向量。
那么就存在数据结构:
相同类型的向量->矩阵 不同类型的向量->数据框
相同类型的矩阵->数组 不同类型的向量、矩阵、数据框、列表或者其中任意两个及以上的组合->列表
2)paste或"operator"
(1)paste表示打印计算结果中元素的组成结构,如:
> outer(1:2,3:5,paste)
[,1] [,2] [,3]
[1,] "1 3" "1 4" "1 5"
[2,] "2 3" "2 4" "2 5"
我们先不考虑outer()函数是如何运算的。
(2)"operator"可以是运算符,包括"+"、"-"、"*"、"/"、"^"等等,需要用双引号引起来,如:
> outer(1:2,3:5,"*")
也即使用paste打印出来的组成元素两两相乘:
[,1] [,2] [,3]
[1,] "1*3" "1*4" "1*5"
[2,] "2*3" "2*4" "2*5"
那么:
> d<-outer(1:2,3:5,"*")
> d
[,1] [,2] [,3]
[1,] 3 4 5
[2,] 6 8 10
2.outer()函数的运算步骤
outer()函数源码中有一句代码为:as.vector(X) %*% t(as.vector(Y))
就是说现将传入参数X和Y先转换成向量,其中Y转换成向量后还要对其进行转置。
注:a.此处向量均指列向量
b.矩阵转换成向量时,先按行遍历矩阵的第一列,然后按行遍历矩阵的第二列,以此类推直到遍历完矩阵的所有元素。(从上到下,从左到右)
如矩阵d:
[,1] [,2] [,3]
[1,] 3 4 5
[2,] 6 8 10
转换成向量为:(3,6,4,8,5,10)T
那么outer(1:2,3:5,"*")就在执行:
第一步:生成x和y向量
_ _ _ _
x=| 1 | y= | 3 |
|_ 2 _| | 4 |
|_ 5 _|
第二步:将y转换成向量,y本身就是向量,因而转换后形式不变。
第三步:将y转置,此时
_ _
x=| 1 | yT=[3,4,5]
|_ 2 _|
第四步:执行x %*% yT 运算(%*%运算与矩阵的乘法运算存在差异,一定不能搞混淆了)
先将x看成一个常数k,用k分别乘以yT中的每个元素,则得到向量[k*3,k*4,k*5]
将k打开,得到矩阵结构:
_ _
| 1*3 1*4 1*5 |
|_ 2*3 2*4 2*5 _|
分别计算矩阵中每一个元素的乘积,得到:
_ _
| 3 4 5 |
|_ 6 8 10 _|
3.拓展举例
我们在R软件的控制台中执行如下代码。
> d<-outer(1:2,3:5,"*")
> d
[,1] [,2] [,3]
[1,] 3 4 5
[2,] 6 8 10
将得到d矩阵,那么在R软件的控制台中继续执行
> dd<-outer(d,d,"*")
> dd
将得到什么呢?
此时:
_ _
d=| 3 4 5 |
|_ 6 8 10 _|
还是按上述步骤执行
第一步:输入两个d向量,则两个d向量分别为:
_ _ _ _
d=| 3 4 5 | d=| 3 4 5 |
|_ 6 8 10 _| |_ 6 8 10 _|
第二和第三步:将第二个矩阵d转换成向量,并将其转置,得到
_ _
d=| 3 4 5 | d'=[3,6,4,8,5,10]
|_ 6 8 10 _| 位于原矩阵d的1行1列,
其中d'=[3,6,4,8,5,10],第一个元素3位于原矩阵(第二个矩阵d)的1行1列,记为(1,1);第而个元素6位于原矩阵的2行1列,记为(2,1);以此类推。
第四步:执行x %*% yT 运算
先将第一个矩阵d看成一个常数k,用k分别乘以第二个向量d'中的每个元素得到[k*3,k*6,k*4,k*8,k*5,k*10]
将k打开,得到矩阵结构:
_ _
| _ _ _ _ _ _ _ _ _ _ _ _ |
| | 3 4 5 |*3, | 3 4 5 |*6, | 3 4 5 |*4, | 3 4 5 |*8, | 3 4 5 |*5, | 3 4 5 |*10 |
| |_ 6 8 10 _| |_ 6 8 10 _| |_ 6 8 10 _| |_ 6 8 10 _| |_ 6 8 10 _| |_ 6 8 10 _| |
|_ _|
3位于第二个矩阵d 6位于第二个矩阵d 4位于第二个矩阵d 8位于第二个矩阵d 5位于第二个矩阵d 10位于第二个矩阵d
的1行1列记为(1,1) 的2行1列记为(2,1) 的1行2列记为(1,2) 的2行2列记为(2,2) 的1行3列记为(1,3) 的2行3列记为(2,3)
然后将各元素乘进去得到:
_ _
| _ _ _ _ _ _ _ _ _ _ _ _ |
| | 3*3 4*3 5*3 |,| 3*6 4*6 5*6 |,| 3*4 4*4 5*4 |,| 3*8 4*8 5*8 |,| 3*5 4*5 5*5 |,| 3*10 4*10 5*10 | |
| |_6*3 8*3 10*3_| |_6*6 8*6 10*6_| |_6*4 8*4 10*4_| |_6*8 8*8 10*8_| |_ 6*5 8*5 10*5_| |_6*10 8*10 10*10_| |
|_ _|
由于第一个矩阵d为二维矩阵,且运算时将其看成一个常数,因而其维数被R语言省略掉了,控制台并没有显示其维数,只用",,"来表示。R控制台中执行:
> outer(d,d,paste)
, , 1, 1 对应第四步中的矩阵下标(1,1)
[,1] [,2] [,3]
[1,] "3 3" "4 3" "5 3"
[2,] "6 3" "8 3" "10 3"
, , 2, 1 对应第四步中的矩阵下标(2,1)
[,1] [,2] [,3]
[1,] "3 6" "4 6" "5 6"
[2,] "6 6" "8 6" "10 6"
, , 1, 2 对应第四步中的矩阵下标(1,2)
[,1] [,2] [,3]
[1,] "3 4" "4 4" "5 4"
[2,] "6 4" "8 4" "10 4"
, , 2, 2 对应第四步中的矩阵下标(2,2)
[,1] [,2] [,3]
[1,] "3 8" "4 8" "5 8"
[2,] "6 8" "8 8" "10 8"
, , 1, 3 对应第四步中的矩阵下标(1,3)
[,1] [,2] [,3]
[1,] "3 5" "4 5" "5 5"
[2,] "6 5" "8 5" "10 5"
, , 2, 3 对应第四步中的矩阵下标(2,3)
[,1] [,2] [,3]
[1,] "3 10" "4 10" "5 10"
[2,] "6 10" "8 10" "10 10"
因而R控制台中执行
> dd<-outer(d,d,"*")
> dd
, , 1, 1 对应第四步中的矩阵下标(1,1)
[,1] [,2] [,3]
[1,] 9 12 15
[2,] 18 24 30
, , 2, 1 对应第四步中的矩阵下标(2,1)
[,1] [,2] [,3]
[1,] 18 24 30
[2,] 36 48 60
, , 1, 2 对应第四步中的矩阵下标(1,2)
[,1] [,2] [,3]
[1,] 12 16 20
[2,] 24 32 40
, , 2, 2 对应第四步中的矩阵下标(2,2)
[,1] [,2] [,3]
[1,] 24 32 40
[2,] 48 64 80
, , 1, 3 对应第四步中的矩阵下标(1,3)
[,1] [,2] [,3]
[1,] 15 20 25
[2,] 30 40 50
, , 2, 3 对应第四步中的矩阵下标(2,3)
[,1] [,2] [,3]
[1,] 30 40 50
[2,] 60 80 100