鸟语天空
矩阵的基本运算
post by:追风剑情 2024-4-16 18:58

  我们知道,数有加、减、乘、除四则运算,那么矩阵有相应的运算吗?本节首先把数的加法、减法和乘法推广到矩阵,得到矩阵的加法,减法,数乘和乘法,然后再介绍矩阵的转置。

1、矩阵的线性运算

两个矩阵的行数和列数都相等时,称它们是同型矩阵。如果两个同型矩阵$A=(a_{ij})_{m×n}$与$B=(b_{ij})_{m×n}$的对应元素相等,即 $$ a_{ij}=b_{ij} \quad (i=1,2,\cdots,m; \; j=1,2,\cdots,n) $$ 则称矩阵A与矩阵B相等,记作A=B

定义 1.2 设$A=(a_{ij})_{m×n}$与$B=(b_{ij})_{m×n}$为同型矩阵,则称矩阵$C=(a_{ij} + b_{ij})_{m×n}$为矩阵A与B的,记作C=A+B

矩阵$(-a_{ij})_{m×n}$称为矩阵$A=(a_{ij})_{m×n}$的负矩阵,记作−A

根据上述定义容易证明,矩阵的加法具有下列运算性质。

性质 1.1 设A,B,C,O都是m×n矩阵,则
(1)A + B = B + A
(2)(A + B) + C = A + (B + C)
(3)A + O = A
(4)A + (−A) = O

利用负矩阵,可以定义矩阵的减法。两个同型矩阵A和B的差 A−B=A+(−B)

显然,矩阵的加法和减法推广了数的加法和减法。下面定义一个数与一个矩阵的数乘运算。该运算可以视为数的乘法的一种推广。

定义 1.3 设k为一个数,$A=(a_{ij})_{m×n}$为一个矩阵,则矩阵$(ka_{ij})_{m×n}$称为数k与矩阵$A=(a_{ij})_{m×n}$的数量乘积,简称为数乘,记作kA

根据这个定义,容易验证数乘运算具有下列运算性质。

性质 1.2 设A,B都是m×n矩阵,k,l为任意数,则
(1)(k + l)A = kA + lA
(2)k(A + B) = kA + kB
(3)k(lA) = (kl)A
(4)1A = A

矩阵的加法与数乘运算统称为矩阵的线性运算

例 1.1 设 $ A=\begin{pmatrix} 1 & 2 \\ -1 & 1 \end{pmatrix} $ , $ B=\begin{pmatrix} -2 & 1 \\ 1 & 2 \end{pmatrix} $ ,求 A+2B

$ A+2B= \begin{pmatrix} 1 & 2 \\ -1 & 1 \end{pmatrix} + \begin{pmatrix} -4 & 2 \\ 2 & 4 \end{pmatrix} = \begin{pmatrix} -3 & 4 \\ 1 & 5 \end{pmatrix} $

注 1.1 设$A=(a_{ij})_{m×n}$,对于任意的$i=1,2,\cdots,m; \; j=1,2,\cdots,n$,用$E_{ij}$表示一个m×n矩阵,其第i行第j列交叉处元素为1而其余元素全为零。例如 $$ E_{11}=\begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & 0 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 0 \\ \end{pmatrix} ,\quad E_{12}=\begin{pmatrix} 0 & 1 & \cdots & 0 \\ 0 & 0 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 0 \\ \end{pmatrix} $$ 于是有 $ \begin{flalign} A= \sum_{i=1}^{m} \sum_{j=1}^{n} a_{ij}E_{ij} \end{flalign} $ 。这些矩阵$E_{ij}(i=1,\cdots,m; \; j=1,\cdots,n)$称为矩阵单位

2、矩阵的乘法

假设变量$x_1,x_2$与$y_1,y_2,y_3$之间有如下线性关系 $$ \begin{equation} \left\{ \begin{aligned} x_1=a_{11}y_1 + a_{12}y_2 + a_{13}y_3 \\ x_2=a_{21}y_1 + a_{22}y_2 + a_{23}y_3 \\ \end{aligned} \right. \tag{1.2.1} \end{equation} $$ 变量$y_1,y_2,y_3$与$z_1,z_2$有如下线性关系 $$ \begin{equation} \left\{ \begin{aligned} y_1=b_{11}z_1 + b_{12}z_2 \\ y_2=b_{21}z_1 + b_{22}z_2 \\ y_3=b_{31}z_1 + b_{32}z_2 \end{aligned} \right. \tag{1.2.2} \end{equation} $$ 那么变量$x_1,x_2$与$z_1,z_2$的关系是什么呢?

将上述(1.2.2)式代入(1.2.1)式得 $$ \begin{equation} \left\{ \begin{aligned} x_1=(a_{11}b_{11} + a_{12}b_{21} + a_{13}b_{31})z_1 + (a_{11}b_{12} + a_{12}b_{22} + a_{13}b_{32})z_2 \\ x_2=(a_{21}b_{11} + a_{22}b_{21} + a_{23}b_{31})z_1 + (a_{21}b_{12} + a_{22}b_{22} + a_{23}b_{32})z_2 \\ \end{aligned} \right. \tag{1.2.3} \end{equation} $$

将(1.2.1),(1.2.2)和(1.2.3)这三个式子对应的矩阵分别记为 $$ A= \begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ \end{pmatrix} ,\quad B= \begin{pmatrix} b_{11} & b_{12} \\ b_{21} & b_{22} \\ b_{31} & b_{32} \\ \end{pmatrix} ,\quad C= \begin{pmatrix} c_{11} & c_{12} \\ c_{21} & c_{22} \\ \end{pmatrix} $$ 则C的第i行第j列交叉处元素为A的第i行的每一个元素与B的第j列对应元素乘积之和,即 $ c_{ij}= \begin{flalign} \sum_{k=1}^{3}a_{ik}b_{kj} \end{flalign} $ ,其中i,j=1,2,此时C称为A与B的。一般地,有如下定义。

定义 1.4 设矩阵$A=(a_{ik})_{m×s},B=(b_{kj})_{s×n}$,作矩阵$C=(c_{ij})_{m×n}$,其中 $$ c_{ij}=a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{is}b_{sj}=\sum_{k=1}^{s}a_{ik}b_{kj} $$

称矩阵C为矩阵A与矩阵B的乘积,记作C=AB,即 $$ \begin{flalign} & \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1s} \\ a_{21} & a_{22} & \cdots & a_{2s} \\ \vdots & \vdots & \quad & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{ms} \\ \end{pmatrix} \begin{pmatrix} b_{11} & b_{12} & \cdots & b_{1n} \\ b_{21} & b_{22} & \cdots & b_{2n} \\ \vdots & \vdots & \quad & \vdots \\ b_{s1} & b_{s2} & \cdots & b_{sn} \\ \end{pmatrix} &\\ &= \begin{pmatrix} a_{11}b_{11}+\cdots+a_{1s}b_{s1} & a_{11}b_{12}+\cdots+a_{1s}b_{s2} & \cdots & a_{11}b_{1n} + \cdots + a_{1s}b_{sn} \\ a_{21}b_{11}+\cdots+a_{2s}b_{s1} & a_{21}b_{12}+\cdots+a_{2s}b_{s2} & \cdots & a_{21}b_{1n} + \cdots + a_{2s}b_{sn} \\ \vdots & \vdots & \vdots \\ a_{m1}b_{11}+\cdots+a_{ms}b_{s1} & a_{m1}b_{12}+\cdots+a_{ms}b_{s2} & \cdots & a_{m1}b_{1n} + \cdots + a_{ms}b_{sn} \\ \end{pmatrix} &\\ \end{flalign} $$ 数学中许多关系用矩阵乘积来表达就非常简洁。例如,n个变量$x_1,x_2,\cdots,x_n$与m个变量$y_1,y_2,\cdots,y_m$之间的关系式 $$ \begin{equation} \left\{ \begin{aligned} y_1&=a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n \\ y_2&=a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n \\ &\quad\quad\cdots\cdots \\ y_m&=a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n \\ \end{aligned} \right. \end{equation} $$ (其中$a_{ij}$为常数)称为从变量$x_1,x_2,\cdots,x_n$到变量$y_1,y_2,\cdots,y_m$的线性变换。利用矩阵乘法,上述线性变换可记为 $$ y=Ax $$ 其中 $$ A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \quad & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix} ,\quad x=\begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \\ \end{pmatrix} ,\quad y=\begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_m \\ \end{pmatrix} $$ 由此可见,一个变量$x_1,x_2,\cdots,x_n$到变量$y_1,y_2,\cdots,y_m$的线性变换可以和一个m×n矩阵A相互确定。

再例如线性方程组 $$ \begin{equation} \left\{ \begin{aligned} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n &= b_1 \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n &= b_2 \\ \cdots\cdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n &= b_m \\ \end{aligned} \right. \end{equation} $$ 可以简洁地表示为 $$ Ax=b $$ 其中 $ A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \quad & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{pmatrix} ,\quad x=\begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \\ \end{pmatrix} ,\quad b=\begin{pmatrix} b_1 \\ b_2 \\ \vdots \\ b_m \\ \end{pmatrix} $ 分别叫做该线性方程组的系数矩阵未知向量常数向量

注 1.2
(1)从矩阵乘积的定义可以看出,只有当左边矩阵A的列数等于右边矩阵B的行数时,乘积AB才有意义。

(2)当AB有意义时,AB的行数与A的行数相等,AB的列数与B的列数相等。

(3)当AB有意义时,BA未必有意义。例如,矩阵$A_{2×3}$和$B_{3×4}$的乘积AB为2×4矩阵,但BA没有意义。

(4)当AB与BA均有意义时,AB与BA也未必相等,甚至都不是同型矩阵,见下面的例子。

例 1.2 设A=(1,2,-3), $ B=\begin{pmatrix} 2 \\ 1 \\ 1 \\ \end{pmatrix} $ ,求AB和BA

$ AB=(1,2,-3) \begin{pmatrix} 2 \\ 1 \\ 1 \\ \end{pmatrix} = 1×2+2×1+(-3)×1=1 $

$ BA=\begin{pmatrix} 2 \\ 1 \\ 1 \\ \end{pmatrix} (1,2,-3) = \begin{pmatrix} 2 & 4 & -6 \\ 1 & 2 & -3 \\ 1 & 2 & -3 \\ \end{pmatrix} $

例 1.3 设 $ A=\begin{pmatrix} 1 & 1 \\ -1 & -1 \\ \end{pmatrix} , B=\begin{pmatrix} -1 & 1 \\ 1 & -1 \\ \end{pmatrix} $ ,求AB和BA

$ AB=\begin{pmatrix} 1 & 1 \\ -1 & -1 \\ \end{pmatrix} \begin{pmatrix} -1 & 1 \\ 1 & -1 \\ \end{pmatrix} = \begin{pmatrix} 0 & 0 \\ 0 & 0 \\ \end{pmatrix} $

$ BA=\begin{pmatrix} -1 & 1 \\ 1 & -1 \\ \end{pmatrix} \begin{pmatrix} 1 & 1 \\ -1 & -1 \\ \end{pmatrix} = \begin{pmatrix} -2 & -2 \\ 2 & 2 \\ \end{pmatrix} $

注 1.3 从例1.3可以看出以下几点。

(1)矩阵的乘法未必满足交换律。

(2)两非零矩阵的乘积可能为零。因而,一般情况下,由AB=O推不出A=O或B=O

(3)消去律一般不成立,也就是说,当A≠O时,由AB=AC未必能够推出B=C。例如,取例1.3中的矩阵A和B,并且取C=O2×2,那么AB=AC,而且A≠O,但B≠C。

可见,矩阵乘法与数的乘法有不同之处,这应该引起特别的注意。但是矩阵乘法与数的乘法仍有一些相似之处。根据定义1.4可以证明以下性质。

(1)结合律:(AB)C=A(BC)
(2)分配律:A(B+C)=AB+AC,(B+C)A=BA+CA
(3)k(AB)=(kA)B=A(kB),其中k为任意数

注 1.4 如果AB=BA,那么我们称A,B可交换。例如:

(1)n阶数量矩阵kE与任意n阶矩阵A可交换。事实上,不难验证 $$ (kE)A=A(kE)=kA $$ 特别地,AE=EA=A。由此可见,单位矩阵E在矩阵乘法运算中起着与数1在数的乘法运算中同样的作用。

(2)两个n阶对角矩阵总是可交换的。事实上,两个n阶对角矩阵A和B的乘积AB仍为对角矩阵,而且AB的主对角线上的元素就是A与B的主对角线上的对应元素之积,即 $$ \begin{pmatrix} a_{11} & \quad & \quad \\ \quad & \ddots & \quad \\ \quad & \quad & a_{nn} \\ \end{pmatrix} \begin{pmatrix} b_{11} & \quad & \quad \\ \quad & \ddots & \quad \\ \quad & \quad & b_{nn} \\ \end{pmatrix} = \begin{pmatrix} a_{11}b_{11} & \quad & \quad \\ \quad & \ddots & \quad \\ \quad & \quad & a_{nn}b_{nn} \\ \end{pmatrix} $$ 由于矩阵的乘法满足结合律,可以定义方阵的幂如下:

设A为n阶矩阵,k为正整数,$A^k$表示k个A相乘,称为A的k次幂。为了方便起见,通常规定$A^0$=E。

容易验证:对于任意正整数k,l,下列等式成立: $$ A^kA^l=A^{k+l}, \quad (A^k)^l=A^{kl} $$

因为矩阵乘法一般不满足交换律,所以$(AB)^k$与$A^kB^k$未必相等,而且与两个矩阵有关的因式分解与二项式定理一般也不成立。但当AB=BA时,可验证 $$ (A+B)^n= \begin{flalign} \sum_{i=0}^{n}C^i_nA^iB^{n-i} \end{flalign} \tag{1.2.4} $$

如果$f(x)=a_mx^m+a_{m-1}x^{m-1}+\cdots+a_1x+a_0$是x的m次多项式,A是n阶矩阵,称 $$ f(A)=a_mA^m+a_{m-1}A^{m-1}+\cdots+a_1A+a_0E $$ 为A的m次多项式。

例 1.4 设A=(1,-1,1), $ B= \begin{pmatrix} 1 \\ 1 \\ 2 \\ \end{pmatrix} $ ,$f(x)=2x^3+x+3$,求$(BA)^n,f(BA)$

AB=2, $ BA=\begin{pmatrix} 1 & -1 & 1 \\ 1 & -1 & 1 \\ 2 & -2 & 2 \\ \end{pmatrix} $ ,于是 $$ \begin{flalign} (BA)^n&=(BA)(BA)\cdots(BA)=B(AB)(AB)\cdots(AB)A &\\ &=B(AB)^{n-1}A=B2^{n-1}A=2^{n-1}BA= \begin{pmatrix} 2^{n-1} & -2^{n-1} & 2^{n-1} \\ 2^{n-1} & -2^{n-1} & 2^{n-1} \\ 2^{n} & -2^{n} & 2^{n} \\ \end{pmatrix} &\\ \end{flalign} $$ $$ \begin{flalign} f(BA)&=2(BA)^3+BA+3E &\\ &=2(BA)(BA)(BA)+BA+3E &\\ &=2B(AB)(AB)A+BA+3E &\\ &=8BA+BA+3E &\\ &=9BA+3E &\\ &=\begin{pmatrix} 12 & -9 & 9 \\ 9 & -6 & 9 \\ 18 & -18 & 21 \\ \end{pmatrix} &\\ \end{flalign} $$

例 1.5 设 $ A=\begin{pmatrix} λ & 1 & 0 \\ 0 & λ & 1 \\ 0 & 0 & λ \\ \end{pmatrix} $ ,求$A^n$

记 $ N=\begin{pmatrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \\ \end{pmatrix} $ ,则 $ N^2=\begin{pmatrix} 0 & 0 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \\ \end{pmatrix} , N^3=\begin{pmatrix} 0 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \\ \end{pmatrix} $,
$A=λE+N$。因为$(λE)N=N(λE)$,由公式(1.2.4)可得 $$ \begin{flalign} A^n&=\sum_{k=0}^{n}C^k_n(λE)^kN^{n-k}=(λE)^n+C^1_n(λE)^{n-1}N+C^2_n(λE)^{n-2}N^2 &\\ &=\begin{pmatrix} λ^n & 0 & 0 \\ 0 & λ^n & 0 \\ 0 & 0 & λ^n \\ \end{pmatrix} + \begin{pmatrix} 0 & nλ^{n-1} & 0 \\ 0 & 0 & nλ^{n-1} \\ 0 & 0 & 0 \\ \end{pmatrix} + \begin{pmatrix} 0 & 0 & \frac{n(n-1)}{2}λ^{n-2} \\ 0 & 0 & 0 \\ 0 & 0 & 0 \\ \end{pmatrix} &\\ &=\begin{pmatrix} λ^n & nλ^{n-1} & \frac{n(n-1)}{2}λ^{n-2} \\ 0 & λ^n & nλ^{n-1} \\ 0 & 0 & λ^n \\ \end{pmatrix} &\\ \end{flalign} $$

评论:
发表评论:
昵称

邮件地址 (选填)

个人主页 (选填)

内容