線性方程組 (Systems of Linear Equations)
本系列文章內容參考自經典教材 Elementary Linear Algebra (Pearson New International Edition)。本文對應章節:Ch1-3 Systems of Linear Equations。
線性方程式 (Linear Equation)
一個線性方程式 (Linear Equation) 是形如
a1x1+a2x2+⋯+anxn=b
的方程式,其中:
- x1,x2,…,xn 為變數 (Variables)
- a1,a2,…,an 為係數 (Coefficients)
- b 為常數項 (Constant Term)
線性方程式的特徵是:每個變數的次方都是 1,且變數之間沒有相乘。
範例:
- 2x+3y=5 ✓ 線性方程式
- 3x+y−z=2 ✓ 線性方程式
- x2+y=1 ✗ 非線性(x 的次方為 2)
- xy+z=3 ✗ 非線性(x 與 y 相乘)
線性方程組 (System of Linear Equations)
一個線性方程組 (System of Linear Equations) 是由多個線性方程式組成的集合。一般形式為 m 個方程式、n 個變數:
a11x1+a12x2+⋯+a1nxna21x1+a22x2+⋯+a2nxnam1x1+am2x2+⋯+amnxn=b1=b2⋮=bm
解 (Solution) 與解集合 (Solution Set)
線性方程組的一個解 (Solution) 是一個向量 s=s1s2⋮sn∈Rn,使得將 xi=si 代入每一個方程式後,所有方程式都成立。
所有解的集合稱為解集合 (Solution Set):
Solution Set=⎩⎨⎧x1x2⋮xn∈Rnx1,x2,…,xn 滿足所有方程式⎭⎬⎫
範例:考慮方程組
{0.80x1+0.60x2+0.40x3=50.20x1+0.40x2+0.60x3=3
向量 251 是一個解,因為:
0.80(2)+0.60(5)+0.40(1)0.20(2)+0.40(5)+0.60(1)=1.6+3.0+0.4=5✓=0.4+2.0+0.6=3✓
Ax = b 與聯立方程式的關係
在上一篇中,我們學到矩陣向量乘積 Ax 是「以 x 的分量為係數,對 A 的 column vectors 做線性組合」。在那個情境下,x 扮演的是係數的角色。
但在這一篇的線性方程組 Ax=b 中,x 又變成了「要求的解」。這兩個角色乍看之下很不一樣,但其實是同一件事:
我的理解方式:
想像你有一組向量(A 的 column vectors),你想知道「要用什麼係數來組合它們,才能湊出目標向量 b」。這些係數就是 x 的各個分量。
- 從「線性組合」的角度:x 是係數
- 從「聯立方程式」的角度:x 是解
這兩個角度描述的是同一個東西!當我們「求解」x 時,其實就是在找「能讓 A 的 column vectors 組合出 b 的係數」。
將線性方程組寫成矩陣形式:
Aa11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amnxx1x2⋮xn=bb1b2⋮bm
這就是著名的 Ax=b 形式,其中:
- A 稱為係數矩陣 (Coefficient Matrix),大小為 m×n
- x 稱為變數向量 (Variable Vector),大小為 n×1
- b 稱為常數向量 (Constant Vector),大小為 m×1
Consistent 與 Inconsistent
根據解的存在性,線性方程組可分為兩類:
| 分類 | 定義 | 解的情況 |
|---|
| Consistent(相容) | 方程組至少有一個解 | 唯一解 或 無限多解 |
| Inconsistent(不相容) | 方程組沒有任何解 | 無解 |
Consistent 只表示「有解」,但不區分是唯一解還是無限多解。
- Consistent + 唯一解:恰好有一個解
- Consistent + 無限多解:有無窮多個解
- Inconsistent:解集合為空集 ∅
範例比較
| 方程組 | 解集合 | 分類 |
|---|
| {3x1+x2=10x1−3x2=0 | {[31]} | Consistent(唯一解) |
| {3x1+x2=106x1+2x2=20 | {[31]+t[−13]:t∈R} | Consistent(無限多解) |
| {3x1+x2=106x1+2x2=0 | ∅ | Inconsistent(無解) |
二元一次方程組的幾何意義
在 R2 中,每個線性方程式 ax+by=c 代表一條直線。兩個方程式組成的方程組,其解就是兩條直線的交點。

上圖展示了二元一次方程組的三種幾何情況:
- 無解:兩條直線平行但不重合,永遠不會相交
- 唯一解:兩條直線相交於一點,該點即為唯一解
- 無限多解:兩條直線完全重合,直線上的每一點都是解
等價方程組 (Equivalent Systems)
兩個線性方程組稱為等價 (Equivalent),若且唯若它們具有完全相同的解集合。
範例:
| 方程組 A | 方程組 B | 解集合 | 等價? |
|---|
| {3x1+x2=10x1−3x2=0 | {3x1+x2=10x1=3 | {[31]} | ✓ Yes |
| {3x1+x2=10x1−3x2=0 | {3x1+x2=106x1+2x2=20 | 不同 | ✗ No |
等價方程組的重要性在於:我們可以將複雜的方程組轉換成較簡單的等價方程組來求解,而不改變解集合。
增廣矩陣 (Augmented Matrix)
將係數矩陣 A 與常數向量 b 合併成一個矩陣,稱為增廣矩陣 (Augmented Matrix),記作 [A∣b]:
[A∣b]=a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amnb1b2⋮bm
增廣矩陣的大小為 m×(n+1)。
範例:方程組
⎩⎨⎧x1−2x2−x3=33x1−6x2−5x3=32x1−x2+x3=0
對應的增廣矩陣為:
[A∣b]=132−2−6−1−1−51330
基本列運算 (Elementary Row Operations)
對矩陣進行以下三種操作,稱為基本列運算 (Elementary Row Operations):
| 類型 | 操作 | 符號 |
|---|
| Interchange(交換) | 交換任意兩列的位置 | Ri↔Rj |
| Scaling(縮放) | 將某一列乘以一個非零純量 | kRi→Ri(k=0) |
| Row Addition(列加法) | 將某一列的倍數加到另一列 | Ri+kRj→Ri |
重要性質
-
可逆性 (Reversibility):每種基本列運算都是可逆的
- 交換:再交換一次即可還原
- 縮放:乘以 k 後,再乘以 k1 即可還原
- 列加法:加上 k 倍後,再加上 −k 倍即可還原
-
保持等價性:對增廣矩陣進行基本列運算,得到的新方程組與原方程組等價
Ax=belementary row operationsA′x=b′
範例:使用基本列運算求解方程組
{3x1+x2=10x1−3x2=0
[311−3100]R1↔R2[13−31010]R2−3R1[10−310010]101R2[10−3101]
從最後的矩陣可讀出 x2=1,代回得 x1=3。
一個矩陣稱為列梯形式 (Row Echelon Form, REF),若滿足以下三個條件:
- 所有全零列都在矩陣的最下方
- 每個非零列的領導元素 (Leading Entry)(即該列最左邊的非零元素)所在的 column,必須在上一列領導元素的右邊
- 若某 column 包含某列的領導元素,則該領導元素下方的所有元素都是 0
領導元素是指每一個非零列中,最左邊的非零元素。它也常被稱為 pivot(主元)。
列梯形式的視覺特徵
列梯形式的矩陣呈現「階梯狀」結構,領導元素形成一個從左上到右下的階梯:
1000∗100∗∗00∗∗10∗∗∗0
其中 1 表示領導元素(不一定是 1),∗ 表示任意數。
為什麼需要 RREF?
列梯形式 (REF) 雖然已經很有結構,但要從中讀出解仍需要回代 (Back Substitution)——從最後一列往上逐步求解。
簡化列梯形式 (RREF) 的優點是:解可以直接讀出來,不需要回代。這是因為 RREF 要求領導元素上下都是 0,使得每個 basic variable 都能獨立表示。
一個矩陣稱為簡化列梯形式 (Reduced Row Echelon Form, RREF),若滿足列梯形式的三個條件,再加上:
- 若某 column 包含某列的領導元素,則該 column 的所有其他元素都是 0
- 每個非零列的領導元素都是 1
REF vs RREF 比較
REF: 100007000021000−3420096300