跳至主要内容

矩陣與向量 (Matrices and Vectors)

備註

本系列文章內容參考自經典教材 Elementary Linear Algebra (Pearson New International Edition)。本文對應章節:Section 1.1 Matrices and Vectors

矩陣 (Matrix)

定義

矩陣 (Matrix) 是一個由純量 (Scalar) 組成的矩形陣列。若一個矩陣有 mm 列 (rows) 與 nn 行 (columns),則稱該矩陣的大小 (Size)m×nm \times n(讀作「mm by nn」)。

A=[a11a12a1na21a22a2nam1am2amn]=[aij]Mm×nA = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix} = [a_{ij}] \in \mathcal{M}_{m \times n}

其中 Mm×n\mathcal{M}_{m \times n} 表示所有大小為 m×nm \times n 的矩陣所構成的集合。

關於「行」與「列」的釐清

剛開始學習線性代數時,常常搞混「行」和「列」。更麻煩的是,根據維基百科所述,中國大陸與台灣對「行」「列」的定義是相反的

Row(橫向)Column(縱向)
台灣
中國大陸

因此,建議直接使用英文術語 Row 和 Column,避免混淆

  • Row:橫向排列,像是一「排」座位
  • Column:縱向排列,像是建築物的「柱子」

在數學符號中,aija_{ij} 表示第 ii 個 row、第 jj 個 column 的元素,這個順序是固定的:先 row 後 column

矩陣的列與行示意圖

基本術語

  • (i,j)(i, j)-元素 ((i, j)-entry):位於第 ii 列、第 jj 行的純量 aija_{ij}
  • 方陣 (Square Matrix):當 m=nm = n 時,稱該矩陣為方陣
  • 子矩陣 (Submatrix):從原矩陣中刪除若干列和/或若干行後所得到的矩陣

範例

B=[6815204564]M3×2B = \begin{bmatrix} 6 & 8 \\ 15 & 20 \\ 45 & 64 \end{bmatrix} \in \mathcal{M}_{3 \times 2}

此矩陣 BB 的大小為 3×23 \times 2(3 列 2 行),其中 b21=15b_{21} = 15b32=64b_{32} = 64


矩陣的相等 (Equality of Matrices)

兩個矩陣 AABB 相等 (Equal),若且唯若:

  1. AABB 具有相同的大小
  2. 所有對應位置的元素皆相等
令 A,BMm×n, 則 A=Baij=bij,  i=1,,m,  j=1,,n\text{令 } A, B \in \mathcal{M}_{m \times n}, \text{ 則 } A = B \Leftrightarrow a_{ij} = b_{ij}, \; \forall i = 1, \ldots, m, \; j = 1, \ldots, n

範例

A=[6815204564],B=[6815214564],C=[6815204564],D=[68152045641738]A = \begin{bmatrix} 6 & 8 \\ 15 & 20 \\ 45 & 64 \end{bmatrix}, \quad B = \begin{bmatrix} 6 & 8 \\ 15 & 21 \\ 45 & 64 \end{bmatrix}, \quad C = \begin{bmatrix} 6 & 8 \\ 15 & 20 \\ 45 & 64 \end{bmatrix}, \quad D = \begin{bmatrix} 6 & 8 \\ 15 & 20 \\ 45 & 64 \\ 17 & 38 \end{bmatrix}
  • A=CA = C(大小相同且所有元素相等)
  • ABA \neq Ba22=2021=b22a_{22} = 20 \neq 21 = b_{22}
  • ADA \neq D(大小不同:AA3×23 \times 2DD4×24 \times 2

矩陣的基本運算

矩陣加法 (Matrix Addition)

AABB 皆為 m×nm \times n 矩陣,則其和 (Sum) A+BA + B 定義為:

(A+B)ij=aij+bij(A + B)_{ij} = a_{ij} + b_{ij}

即對應位置的元素相加。

範例

[123456]+[111112]=[234568]\begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{bmatrix} + \begin{bmatrix} 1 & 1 \\ 1 & 1 \\ 1 & 2 \end{bmatrix} = \begin{bmatrix} 2 & 3 \\ 4 & 5 \\ 6 & 8 \end{bmatrix}

純量乘法 (Scalar Multiplication)

AAm×nm \times n 矩陣,cc 為純量。純量乘積 (Scalar Multiple) cAcA 定義為:

(cA)ij=caij(cA)_{ij} = c \cdot a_{ij}

即矩陣中每個元素都乘以 cc

範例

3[231415]=[69312315]3 \cdot \begin{bmatrix} 2 & 3 \\ 1 & 4 \\ -1 & 5 \end{bmatrix} = \begin{bmatrix} 6 & 9 \\ 3 & 12 \\ -3 & 15 \end{bmatrix}

矩陣減法 (Matrix Subtraction)

對於相同大小的矩陣 AABB,其差 (Difference) 定義為:

AB=A+(B)=A+(1)BA - B = A + (-B) = A + (-1)B

其中 (AB)ij=aijbij(A - B)_{ij} = a_{ij} - b_{ij}


零矩陣 (Zero Matrix)

所有元素皆為 00m×nm \times n 矩陣稱為 m×nm \times n 零矩陣,記為 OOOm×nO_{m \times n}

O2×3=[000000]O_{2 \times 3} = \begin{bmatrix} 0 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix}

性質

  • A+O=O+A=AA + O = O + A = A(加法單位元素)
  • 0A=O0 \cdot A = O(任何矩陣乘以純量 0 得零矩陣)
注意

不同大小的零矩陣雖然都記為 OO,但它們是不同的矩陣。例如 O2×2O_{2 \times 2}O3×2O_{3 \times 2} 是不同的零矩陣。


定理 1.1:矩陣加法與純量乘法的性質

AABBCCm×nm \times n 矩陣,sstt 為純量,則:

性質公式名稱
(a)A+B=B+AA + B = B + A加法交換律
(b)(A+B)+C=A+(B+C)(A + B) + C = A + (B + C)加法結合律
(c)A+O=AA + O = A加法單位元素
(d)A+(A)=OA + (-A) = O加法反元素
(e)(st)A=s(tA)(st)A = s(tA)純量乘法結合律
(f)s(A+B)=sA+sBs(A + B) = sA + sB分配律(對矩陣)
(g)(s+t)A=sA+tA(s + t)A = sA + tA分配律(對純量)

轉置 (Transpose)

定義

一個 m×nm \times n 矩陣 AA轉置 (Transpose),記為 ATA^T,是一個 n×mn \times m 矩陣,其 (i,j)(i, j)-元素等於 AA(j,i)(j, i)-元素。

(AT)ij=aji(A^T)_{ij} = a_{ji}

換言之,轉置操作將矩陣的列與行互換。

範例

C=[7918315268]CT=[7185293168]C = \begin{bmatrix} 7 & 9 \\ 18 & 31 \\ 52 & 68 \end{bmatrix} \Rightarrow C^T = \begin{bmatrix} 7 & 18 & 52 \\ 9 & 31 & 68 \end{bmatrix}

定理 1.2:轉置的性質

AABBm×nm \times n 矩陣,ss 為純量,則:

性質公式
(a)(A+B)T=AT+BT(A + B)^T = A^T + B^T
(b)(sA)T=sAT(sA)^T = sA^T
(c)(AT)T=A(A^T)^T = A

向量 (Vector)

定義

  • 列向量 (Row Vector):只有一列的矩陣,即 1×n1 \times n 矩陣

    [1234]\begin{bmatrix} 1 & 2 & 3 & 4 \end{bmatrix}

  • 行向量 (Column Vector):只有一行的矩陣,即 m×1m \times 1 矩陣

    [1234] 或等價地寫成 [1234]T\begin{bmatrix} 1 \\ 2 \\ 3 \\ 4 \end{bmatrix} \text{ 或等價地寫成 } \begin{bmatrix} 1 & 2 & 3 & 4 \end{bmatrix}^T

注意

在這本教材中,除非特別說明,向量 (Vector) 一詞預設指的是 Column Vector

向量空間 Rⁿ

Rn\mathbb{R}^n 表示所有具有 nn 個實數分量的行向量所構成的集合:

Rn=Mn×1\mathbb{R}^n = \mathcal{M}_{n \times 1}

對於向量 vRn\mathbf{v} \in \mathbb{R}^n

v=[v1v2vn]\mathbf{v} = \begin{bmatrix} v_1 \\ v_2 \\ \vdots \\ v_n \end{bmatrix}

其中 viv_i 稱為 v\mathbf{v} 的第 ii分量 (Component)

零向量 (Zero Vector)

所有分量皆為 00 的向量稱為零向量,記為 0\mathbf{0}

u+0=u,0u=0\mathbf{u} + \mathbf{0} = \mathbf{u}, \quad 0 \cdot \mathbf{u} = \mathbf{0}

向量的幾何意義

R² 中的向量

在二維平面中,向量 v=[ab]\mathbf{v} = \begin{bmatrix} a \\ b \end{bmatrix} 可視為從原點 (0,0)(0, 0) 指向點 (a,b)(a, b) 的有向線段。

二維向量示意圖

向量加法的幾何意義

兩個向量 u\mathbf{u}v\mathbf{v} 的和 u+v\mathbf{u} + \mathbf{v} 可透過平行四邊形法則首尾相接法來理解:

  1. v\mathbf{v} 的起點移至 u\mathbf{u} 的終點
  2. 從原點到 v\mathbf{v} 新終點的向量即為 u+v\mathbf{u} + \mathbf{v}

向量加法示意圖

純量乘法的幾何意義

純量 cc 與向量 v\mathbf{v} 的乘積 cvc\mathbf{v}

  • c>1c > 1 時:向量被拉長
  • 0<c<10 < c < 1 時:向量被縮短
  • c<0c < 0 時:向量反向並依 c|c| 縮放

純量乘法示意圖


矩陣與向量的關係

任何 m×nm \times n 矩陣 CC 都可以視為:

  • mm列向量的堆疊
  • nn行向量的並排
C=[c1c2cn]C = \begin{bmatrix} \mathbf{c}_1 & \mathbf{c}_2 & \cdots & \mathbf{c}_n \end{bmatrix}

其中每個 cj\mathbf{c}_j 是一個 m×1m \times 1 的 column vector:

cj=[c1jc2jcmj]\mathbf{c}_j = \begin{bmatrix} c_{1j} \\ c_{2j} \\ \vdots \\ c_{mj} \end{bmatrix}

這種觀點在後續討論線性組合、column space、row space 等概念時非常重要。