zoukankan      html  css  js  c++  java
  • 统计分析与R软件-chapter2-5

    2.5 多维数组和矩阵

    2.5.1 生成数组或矩阵

    数组有一个特征属性叫做维数向量(dim属性),维数向量是一个元素取正整数的向量,其长度是数组的维数,比如维数向量有两个元素时数组为2维数组(矩阵)。维数向量的每一个元素指定了该下标的上界,下标的下界总为1

    1.将向量定义成数组

    向量只有定义了维数向量(dim属性)后才能被看作是数组

    > z<-1:12
    > dim(z)<-c(3,4);z
         [,1] [,2] [,3] [,4]
    [1,]    1    4    7   10
    [2,]    2    5    8   11
    [3,]    3    6    9   12
    > dim(z)<-12;z
     [1]  1  2  3  4  5  6  7  8  9 10 11 12
    

    2.用array()函数构造多维数组

    R软件可以用array()函数直接构造数组,其构造形式为

    array(data=NA,dim=length(data),dimnames=NULL)

    其中data是一个向量数据,dim是数组各维的长度,缺省时是原向量的长度,dimnames是数组维的名字,缺省时为空

    > X<- array(1:20,dim=c(4,5));X
         [,1] [,2] [,3] [,4] [,5]
    [1,]    1    5    9   13   17
    [2,]    2    6   10   14   18
    [3,]    3    7   11   15   19
    [4,]    4    8   12   16   20
    > Z<- array(0,dim=c(3,4,2));Z
    , , 1
    
         [,1] [,2] [,3] [,4]
    [1,]    0    0    0    0
    [2,]    0    0    0    0
    [3,]    0    0    0    0
    
    , , 2
    
         [,1] [,2] [,3] [,4]
    [1,]    0    0    0    0
    [2,]    0    0    0    0
    [3,]    0    0    0    0
    

    3.用matrix()函数构造矩阵

    函数matrix()是构造矩阵的函数,其构造形式为

    matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL)

    其中data是一个向量数据,nrow是矩阵的行数,ncol是矩阵的列数。当byrow=TRUE时,生成矩阵的数据按行放置,缺省时相当于byrow=FALSE,数据按列放置。dimnames是数组维数的名字,缺省时为空

    > A<- matrix(1:15,nrow=3,ncol=5,byrow = TRUE);A
         [,1] [,2] [,3] [,4] [,5]
    [1,]    1    2    3    4    5
    [2,]    6    7    8    9   10
    [3,]   11   12   13   14   15
    > A<- matrix(1:15,nrow=3,byrow=TRUE);A
         [,1] [,2] [,3] [,4] [,5]
    [1,]    1    2    3    4    5
    [2,]    6    7    8    9   10
    [3,]   11   12   13   14   15
    

    2.5.2 数组下标

    1.数组下标

    > a<-1:24
    > dim(a)<-c(2,3,4)
    > a[2,1,2]
    [1] 8
    > a[1,2:3,2:3]
         [,1] [,2]
    [1,]    9   15
    [2,]   11   17
    > a
    , , 1
    
         [,1] [,2] [,3]
    [1,]    1    3    5
    [2,]    2    4    6
    
    , , 2
    
         [,1] [,2] [,3]
    [1,]    7    9   11
    [2,]    8   10   12
    
    , , 3
    
         [,1] [,2] [,3]
    [1,]   13   15   17
    [2,]   14   16   18
    
    , , 4
    
         [,1] [,2] [,3]
    [1,]   19   21   23
    [2,]   20   22   24
    
    > a[1,,]
         [,1] [,2] [,3] [,4]
    [1,]    1    7   13   19
    [2,]    3    9   15   21
    [3,]    5   11   17   23
    > a[,2,]
         [,1] [,2] [,3] [,4]
    [1,]    3    9   15   21
    [2,]    4   10   16   22
    > a[1,1,]
    [1]  1  7 13 19
    > a[3:10]
    [1]  3  4  5  6  7  8  9 10
    

    2.不规则的数组下标

    在R语言中,甚至可以把数组中的任意位置的元素作为数组访问,其方法是用一个二维数组作为数组的下标,二维数组的每一个行是一个元素的下标,列数为数组的维数。

    例如,要把上面的形状为234的数组a的第[1,1,1],[2,2,3],[1,3,4],[2,1,4]号共四个元素作为一个整体访问,先定义一个包含这些下标作为行的二维数组:

    > b<- matrix(c(1,1,1,2,2,3,1,3,4,2,1,4),ncol=3,byrow = TRUE);b
         [,1] [,2] [,3]
    [1,]    1    1    1
    [2,]    2    2    3
    [3,]    1    3    4
    [4,]    2    1    4
    > a[b]
    [1]  1 16 23 20
    > a[b]<-c(101,102,103,104);a[b]
    [1] 101 102 103 104
    > a
    , , 1
    
         [,1] [,2] [,3]
    [1,]  101    3    5
    [2,]    2    4    6
    
    , , 2
    
         [,1] [,2] [,3]
    [1,]    7    9   11
    [2,]    8   10   12
    
    , , 3
    
         [,1] [,2] [,3]
    [1,]   13   15   17
    [2,]   14  102   18
    
    , , 4
    
         [,1] [,2] [,3]
    [1,]   19   21  103
    [2,]  104   22   24
    

    2.5.3 数组的四则运算

    > A<- matrix(1:6,nrow = 2,byrow = TRUE);A
         [,1] [,2] [,3]
    [1,]    1    2    3
    [2,]    4    5    6
    > B<- matrix(1:6,nrow = 2);B
         [,1] [,2] [,3]
    [1,]    1    3    5
    [2,]    2    4    6
    > C<- matrix(c(1,2,2,3,3,4),nrow = 2);C
         [,1] [,2] [,3]
    [1,]    1    2    3
    [2,]    2    3    4
    > D<- 2*C+A/B;D
         [,1]     [,2] [,3]
    [1,]    3 4.666667  6.6
    [2,]    6 7.250000  9.0
    

    形状不一致的向量(或数组)也可以进行四则运算,一般的规则是将向量(或数组)中的数据与对应向量(或数组)中的数据进行运算,把短向量(或数组)的数据循环使用,从而可以与长向量(或数组)数据进行匹配,并尽可能保留共同的数组属性

    > x1<-c(100,200)
    > x2<-1:6
    > x1+x2
    [1] 101 202 103 204 105 206
    > x3<- matrix(1:6,nrow = 3)
    > x1+x3
         [,1] [,2]
    [1,]  101  204
    [2,]  202  105
    [3,]  103  206
    > x2<- 1:5
    > x1+x2
    [1] 101 202 103 204 105
    Warning message:
    In x1 + x2 : 长的对象长度不是短的对象长度的整倍数
    

    2.5.4 矩阵的运算

    1.转置运算

    > A<-matrix(1:6,nrow=2);A
         [,1] [,2] [,3]
    [1,]    1    3    5
    [2,]    2    4    6
    > t(A)
         [,1] [,2]
    [1,]    1    2
    [2,]    3    4
    [3,]    5    6
    > ### 2.求方阵的行列式
    > det(matrix(1:4,ncol=2))
    [1] -2
    > ### 3.向量的内积
    > x<-1:5;y<-2*1:5
    > x%*%y
         [,1]
    [1,]  110
    

    函数crossprod()是内积运算函数(表示交叉乘积),crossprod(x,y)计算向量x与y的内积,即't(x) %*% y'

    > crossprod(x,y)
         [,1]
    [1,]  110
    > x;t(x)
    [1] 1 2 3 4 5
         [,1] [,2] [,3] [,4] [,5]
    [1,]    1    2    3    4    5
    

    crossprod(x)表示x与x的内积,即(||x||^2_2)

    类似地,tcrossprod(x,y)表示'x%*% t(y)',即x与y的外积,也称为叉积。tcrossprod(x)表示x与x作外积

    > tcrossprod(x,y)
         [,1] [,2] [,3] [,4] [,5]
    [1,]    2    4    6    8   10
    [2,]    4    8   12   16   20
    [3,]    6   12   18   24   30
    [4,]    8   16   24   32   40
    [5,]   10   20   30   40   50
    > tcrossprod(x)
         [,1] [,2] [,3] [,4] [,5]
    [1,]    1    2    3    4    5
    [2,]    2    4    6    8   10
    [3,]    3    6    9   12   15
    [4,]    4    8   12   16   20
    [5,]    5   10   15   20   25
    

    4.向量的外积(叉积)

    设x,y是n维向量,则x %o% y表示x与y作外积

    > x<-1:5;y<-2*1:5
    > x %o% y
         [,1] [,2] [,3] [,4] [,5]
    [1,]    2    4    6    8   10
    [2,]    4    8   12   16   20
    [3,]    6   12   18   24   30
    [4,]    8   16   24   32   40
    [5,]   10   20   30   40   50
    

    outer()是外积运算函数,outer(x,y)计算向量x与y的外积,它等价于 x %o% y

    函数outer()的一般调用格式为

    outer(X,Y,fun='*',...)

    其中X,Y矩阵(或向量),fun是作外积运算函数,缺省值为乘法运算,函数outer()在绘制三维曲面时非常有用,它可以生成一个X和Y的网格,

    > outer(x,y)
         [,1] [,2] [,3] [,4] [,5]
    [1,]    2    4    6    8   10
    [2,]    4    8   12   16   20
    [3,]    6   12   18   24   30
    [4,]    8   16   24   32   40
    [5,]   10   20   30   40   50
    

    5.矩阵的乘法

    如果矩阵A和B具有相同的维数,则AB表示矩阵中对应的元素的乘积,A %% B表示通常意义下的两个矩阵的乘积(要求矩阵A的列数等于矩阵B的行数)

    > A<-array(1:9,dim=(c(3,3)))
    > B<-array(9:1,dim=(c(3,3)))
    > C<-A*B;C
         [,1] [,2] [,3]
    [1,]    9   24   21
    [2,]   16   25   16
    [3,]   21   24    9
    > D<- A%*%B;D
         [,1] [,2] [,3]
    [1,]   90   54   18
    [2,]  114   69   24
    [3,]  138   84   30
    

    crossprod(A,B)表示的是t(A)%%B,函数tcrossprod(A,B)表示的是A%%t(B)

    > A
         [,1] [,2] [,3]
    [1,]    1    4    7
    [2,]    2    5    8
    [3,]    3    6    9
    > B<-c(1:3);B
    [1] 1 2 3
    > crossprod(B,A)
         [,1] [,2] [,3]
    [1,]   14   32   50
    > t(B);crossprod(t(B),A)
         [,1] [,2] [,3]
    [1,]    1    2    3
    Error in crossprod(t(B), A) : 非整合参数
    > tcrossprod(A,B)
    Error in tcrossprod(A, B) : 非整合参数
    > tcrossprod(A,t(B))
         [,1]
    [1,]   30
    [2,]   36
    [3,]   42
    

    6.生成对角阵和矩阵取对角运算

    函数diag()依赖于它的变量,当v是一个向量时,diag(v)表示以v的元素为对角线元素的对角阵。当M是一个矩阵时,则diag(M)表示的是取M对角线上的元素的向量

    > v<-c(1,4,5)
    > diag(v)
         [,1] [,2] [,3]
    [1,]    1    0    0
    [2,]    0    4    0
    [3,]    0    0    5
    > M<-array(1:9,dim=c(3,3));M
         [,1] [,2] [,3]
    [1,]    1    4    7
    [2,]    2    5    8
    [3,]    3    6    9
    > diag(M)
    [1] 1 5 9
    

    7.解线性方程组和求矩阵的逆矩阵

    若求解线性方程组Ax=b,其命令形式为solve(A,b),求矩阵A的逆,其命令形式为solve(A)

    > A<-t(array(c(1:8,10),dim=c(3,3)))
    > b<-c(1,1,1)
    > x<-solve(A,b);x
    [1] -1.000000e+00  1.000000e+00  3.330669e-16
    > B<-solve(A);B
               [,1]      [,2] [,3]
    [1,] -0.6666667 -1.333333    1
    [2,] -0.6666667  3.666667   -2
    [3,]  1.0000000 -2.000000    1
    > A %*% B
         [,1]         [,2]          [,3]
    [1,]    1 8.881784e-16 -4.440892e-16
    [2,]    0 1.000000e+00 -1.776357e-15
    [3,]    0 0.000000e+00  1.000000e+00
    

    8.求矩阵的特征值与特征值向量

    eigen(Sm)是求对称矩阵Sm的特征值与特征向量,其命令形式为

    ev<-eigen(Sm)

    ev存放着对称矩阵Sm特征值和特征向量,是由列表形式给出,其中ev(values是Sm的特征值构成的向量,ev)vectors是Sm的特征向量构成的矩阵

    > A
         [,1] [,2] [,3]
    [1,]    1    2    3
    [2,]    4    5    6
    [3,]    7    8   10
    > Sm<-crossprod(A,A);Sm
         [,1] [,2] [,3]
    [1,]   66   78   97
    [2,]   78   93  116
    [3,]   97  116  145
    > ev<-eigen(Sm);ev
    eigen() decomposition
    $values
    [1] 303.19533618   0.76590739   0.03875643
    
    $vectors
               [,1]         [,2]       [,3]
    [1,] -0.4646675  0.833286355  0.2995295
    [2,] -0.5537546 -0.009499485 -0.8326258
    [3,] -0.6909703 -0.552759994  0.4658502
    

    9.矩阵的奇异值分解

    函数svd(A)是对称A作奇异值分解,即A=UDV',其中U,V是正交阵,D为对角阵,也就是矩阵A的奇异值。svd(A)的返回值也是列表,svd(A)(d表示矩阵A的奇异值,即矩阵D的对角线上的元素,svd(A))u对应的是正交阵U,svd(A)$v对应的是正交阵V

    > svdA<-svd(A);svdA
    $d
    [1] 17.4125052  0.8751614  0.1968665
    
    $u
               [,1]        [,2]       [,3]
    [1,] -0.2093373  0.96438514  0.1616762
    [2,] -0.5038485  0.03532145 -0.8630696
    [3,] -0.8380421 -0.26213299  0.4785099
    
    $v
               [,1]         [,2]       [,3]
    [1,] -0.4646675 -0.833286355  0.2995295
    [2,] -0.5537546  0.009499485 -0.8326258
    [3,] -0.6909703  0.552759994  0.4658502
    
    > attach(svdA)
    The following object is masked _by_ .GlobalEnv:
    
        v
    
    > u %*% diag(d) %*% t(v)
    Error in u %*% diag(d) %*% t(v) : 非整合参数
    

    10.求矩阵行列式的值

    > det(A)
    [1] -3
    

    11.最小拟合与QR分解

    > x<-c(0.0,0.2,0.4,0.6,0.8)
    > y<-c(0.9,1.9,2.8,3.3,4.2)
    > lsfit.sol<-lsfit(x,y);lsfit.sol
    $coefficients
    Intercept         X 
         1.02      4.00 
    
    $residuals
    [1] -0.12  0.08  0.18 -0.12 -0.02
    
    $intercept
    [1] TRUE
    
    $qr
    $qt
    [1] -5.85849810  2.52982213  0.23749843 -0.02946714  0.10356728
    
    $qr
          Intercept          X
    [1,] -2.2360680 -0.8944272
    [2,]  0.4472136  0.6324555
    [3,]  0.4472136 -0.1954395
    [4,]  0.4472136 -0.5116673
    [5,]  0.4472136 -0.8278950
    
    $qraux
    [1] 1.447214 1.120788
    
    $rank
    [1] 2
    
    $pivot
    [1] 1 2
    
    $tol
    [1] 1e-07
    
    attr(,"class")
    [1] "qr"
    

    (coefficients是拟合系数,)residuals是拟合残差

    与lsfit()函数有密切关系的函数是ls.diag(),它给出拟合的进一步统计信息

    另一个最小二乘拟合有密切关系的函数是QR分解函数qr(),qe.coef(),qr.fitted()和qr.resid()

    > X<-matrix(c(rep(1,5),x),ncol = 2);X
         [,1] [,2]
    [1,]    1  0.0
    [2,]    1  0.2
    [3,]    1  0.4
    [4,]    1  0.6
    [5,]    1  0.8
    > Xplus<-qr(X);Xplus
    $qr
               [,1]       [,2]
    [1,] -2.2360680 -0.8944272
    [2,]  0.4472136  0.6324555
    [3,]  0.4472136 -0.1954395
    [4,]  0.4472136 -0.5116673
    [5,]  0.4472136 -0.8278950
    
    $rank
    [1] 2
    
    $qraux
    [1] 1.447214 1.120788
    
    $pivot
    [1] 1 2
    
    attr(,"class")
    [1] "qr"
    

    QR分解函数qr()输入的设计矩阵需要加以1为元素的列,其返回值是列表,其中(qr矩阵的上三角阵是QR分解中得到的R矩阵,下三角阵是QR分解得到的正交阵Q的部分信息,)qraux是Q的附加信息

    可用QR分解得到的结果计算最小二乘的系数

    > b<- qr.coef(Xplus,y);b
    [1] 1.02 4.00
    

    得到的系数与函数lsfit()得到的结果相同,但是为什么用这种方法计算呢?这是因为用QR分解在计算最小二乘拟合时,其计算误差比一般方法要小

    类似的,可以用QR分解得到最小二乘的拟合值和残差值

    > fit<-qr.fitted(Xplus,y);fit
    [1] 1.02 1.82 2.62 3.42 4.22
    > res<-qr.resid(Xplus,y);res
    [1] -0.12  0.08  0.18 -0.12 -0.02
    

    2.5.5 与矩阵(数组)运算相关的函数

    1.取矩阵的维数

    > A<-matrix(1:6,nrow=2);A
         [,1] [,2] [,3]
    [1,]    1    3    5
    [2,]    2    4    6
    > dim(A)
    [1] 2 3
    > nrow(A)
    [1] 2
    > ncol(A)
    [1] 3
    

    2.矩阵的合并

    函数cbind()把其自变量横向拼成一个大矩阵,rbind()把其自变量纵向拼成一个大矩阵

    > x1<-rbind(c(1,2),c(3,4));x1
         [,1] [,2]
    [1,]    1    2
    [2,]    3    4
    > x2<-10+x1
    > x3<-cbind(x1,x2);x3
         [,1] [,2] [,3] [,4]
    [1,]    1    2   11   12
    [2,]    3    4   13   14
    > x4<-rbind(x1,x2);x4
         [,1] [,2]
    [1,]    1    2
    [2,]    3    4
    [3,]   11   12
    [4,]   13   14
    > cbind(1,x1)
         [,1] [,2] [,3]
    [1,]    1    1    2
    [2,]    1    3    4
    

    3.矩阵的拉直

    > A<-matrix(1:6,nrow=2);A
         [,1] [,2] [,3]
    [1,]    1    3    5
    [2,]    2    4    6
    > as.vector(A)
    [1] 1 2 3 4 5 6
    

    4.数组的维名字

    > X<-matrix(1:6,ncol=2,dimnames = list(c("one","two","three"),c("First","Second")),byrow=T);X
          First Second
    one       1      2
    two       3      4
    three     5      6
    > X<-matrix(1:6,ncol=2,byrow=T)
    > dimnames(X)<-list(c("one","two","three"),c("First","Second"))
    > colnames(X)
    [1] "First"  "Second"
    > rownames(X)
    [1] "one"   "two"   "three"
    

    5.矩阵的广义转置

    可以用aperm(A,perm)函数把数组A的各维按perm中指定的新次序重新排列

    > A<-array(1:24,dim=c(2,3,4));A
    , , 1
    
         [,1] [,2] [,3]
    [1,]    1    3    5
    [2,]    2    4    6
    
    , , 2
    
         [,1] [,2] [,3]
    [1,]    7    9   11
    [2,]    8   10   12
    
    , , 3
    
         [,1] [,2] [,3]
    [1,]   13   15   17
    [2,]   14   16   18
    
    , , 4
    
         [,1] [,2] [,3]
    [1,]   19   21   23
    [2,]   20   22   24
    
    > B<-aperm(A,c(2,3,1));B
    , , 1
    
         [,1] [,2] [,3] [,4]
    [1,]    1    7   13   19
    [2,]    3    9   15   21
    [3,]    5   11   17   23
    
    , , 2
    
         [,1] [,2] [,3] [,4]
    [1,]    2    8   14   20
    [2,]    4   10   16   22
    [3,]    6   12   18   24
    

    结果是B把A的第2维移到了第1维,A的第3维移到了第2维,A的第1维移到了第3维,这时有B[i,j,k]=A[i,k,i]

    > B[1,3,2];A[3,2,1]
    [1] 14
    Error in A[3, 2, 1] : 下标出界
    

    6.apply函数

    对于向量,可以用sum,mean等函数对其进行计算,对于数组(矩阵),如果想对其1维(或若干维)进行某种计算,可用apply函数,其一般形式为

    apply(A,MARGIN,FUN,...)

    其中A为一个数组,MARGIN是固定哪些维不变,FUN是用来计算的函数

    > A<-matrix(1:6,nrow=2);A
         [,1] [,2] [,3]
    [1,]    1    3    5
    [2,]    2    4    6
    > apply(A, 1, sum)
    [1]  9 12
    > apply(A, 2, mean)
    [1] 1.5 3.5 5.5
    
  • 相关阅读:
    处理了一个“服务器能ping得通,但telnet连接失败”导致数据库登录不了的问题
    解决了一个oracle登录缓慢的问题
    今天解决了一个mysql远程登录和本机ip登录都失败的问题
    c++笔记
    c语言笔记
    常见并发与系统设计
    linux网络IO笔记
    linux文件IO全景解析
    linux网络协议笔记
    长大后才懂的蜡笔小新 ​​​​
  • 原文地址:https://www.cnblogs.com/SweetZxl/p/chapter2-5.html
Copyright © 2011-2022 走看看