線性變換與矩陣 (Linear Transformations and Matrices)
本系列文章內容參考自經典教材 Elementary Linear Algebra (Pearson New International Edition)。本文對應章節:Ch2-7 Linear Transformations and Matrices。
在學習線性代數的過程中,我們逐漸將「矩陣」從一個靜態的數字表格,轉變為可以「作用」在向量上的動態工具。本章將正式引入線性變換 (Linear Transformation) 的概念,揭示矩陣與函數之間深刻 的聯繫。
我們先回顧函數的概念:一個從集合 V 到集合 W 的函數 (Function) T,記作 T:V→W,是一種對應規則,將 V 中的每個元素 v 對應到 W 中唯一的元素 T(v)。
當 V 和 W 都是向量空間時,我們習慣使用以下術語:
| 術語 | 說明 |
|---|
| 變換 (Transformation) | 向量空間之間的函數 |
| 運算子 (Operator) | 從向量空間映射到自身的變換(T:V→V) |
| 定義域 (Domain) | 輸入集合 V |
| 對應域 (Codomain) | 輸出所屬的集合 W |
| 值域 (Range / Image) | 所有實際輸出的集合 {T(v)∣v∈V} |
並非所有變換都值得特別研究。線性代數關注的是那些「保持結構」的變換——也就是線性變換。
設 V 和 W 是向量空間,一個變換 T:V→W 稱為線性變換 (Linear Transformation),若且唯若對於所有 u,v∈V 和所有純量 c,滿足以下兩個條件:
(i) 加法保持性:(ii) 純量乘法保持性:T(u+v)=T(u)+T(v)T(cu)=cT(u)
這兩個條件可以合併為一個等價條件:
T(c1u+c2v)=c1T(u)+c2T(v)
更一般地,線性變換保持線性組合 (Linear Combination):
T(c1v1+c2v2+⋯+ckvk)=c1T(v1)+c2T(v2)+⋯+ckT(vk)
重要性質
從定義可以直接推導出線性變換的一個關鍵性質:
T(0)=0
證明:T(0)=T(0⋅v)=0⋅T(v)=0。 □
這個性質提供了一個快速排除法:如果 T(0)=0,那麼 T 一定不是線性變換!
舉例來說,考慮 T(x)=2x+3:
- T(0)=2(0)+3=3=0
因此 T(x)=2x+3 不是線性變換。這是因為它包含了一個常數項 +3,使得原點不再映射到原點。
記憶口訣:「線性必過原點」。只要有任何「平移」成分(如 +3),就不可能是線性變換。
定義 T0:V→W,T0(v)=0(對所有 v∈V)。
這是一個線性變換,因為對任意 u,v∈V 和純量 c:
- T0(u+v)=0=0+0=T0(u)+T0(v) ✓
- T0(cu)=0=c⋅0=cT0(u) ✓
定義 I:V→V,I(v)=v(對所有 v∈V)。
這也是一個線性變換:
- I(u+v)=u+v=I(u)+I(v) ✓
- I(cu)=cu=cI(u) ✓
範例 3:純量乘法變換
定義 Tk:V→V,Tk(v)=kv,其中 k 是固定純量。
- Tk(u+v)=k(u+v)=ku+kv=Tk(u)+Tk(v) ✓
- Tk(cu)=k(cu)=c(ku)=cTk(u) ✓
給定一個 m×n 矩陣 A,定義 TA:Rn→Rm,TA(x)=Ax。
由矩陣乘法的性質:
- TA(u+v)=A(u+v)=Au+Av=TA(u)+TA(v) ✓
- TA(cu)=A(cu)=cAu=cTA(u) ✓
這是本章最重要的範例——每個矩陣都自然地定義了一個線性變換!
既然知道每個線性變換 T 都對應一個標準矩陣 A,我們就可以透過觀察矩陣 A 的樣子,來推斷這個變換的幾何行為。
以下展示幾種常見的 R2 線性變換與其對應的標準矩陣:
縮放變換 (Scaling)
矩陣 A=[sx00sy] 會將向量沿 x 軸和 y 軸分別縮放 sx 和 sy 倍。

旋轉變換 (Rotation)
矩陣 Rθ=[cosθsinθ−sinθcosθ] 會將向量繞原點逆時針旋轉 θ 角度。

反射變換 (Reflection)
矩陣 [100−1] 會將向量相對於 x 軸反射(即上下翻轉)。

剪切變換 (Shear)
矩陣 [10k1] 會沿 x 方向進行剪切變換。

下圖以動態方式展示一個單位正方形在不同線性變換下的形變過程。注意到格線保持平行且等距,這正是線性變換的幾何特徵:直線保持為直線,原點保持不動,且平行線仍保持平行。
標準矩陣 (Standard Matrix)
什麼是標準矩陣?
前面提到線性變換 T 是一個抽象的函數規則(例如「逆時針旋轉 45 度」)。為了方便計算,我們需要一個具體的數學工具——矩陣。
事實上,每一個線性變換 T 都有一個唯一的矩陣 A 與之對應,使得:
T(x)=Ax
這個矩陣 A 就稱為 T 的標準矩陣 (Standard Matrix)。
如何建構標準矩陣?
找標準矩陣的方法非常簡單:我們只需要知道 「標準基底向量」變換後去了哪裡。在數學上,變換後的結果 T(x) 稱為 x 在 T 作用下的 像 (Image)。
具體步驟(以 R2 為例):
- 準備基底:拿出 e1=[10] 和 e2=[01]。
- 執行變換:找出它們的像 T(e1) 和 T(e2)。
- 填入矩陣:將這些像向量依序填入矩陣的行 (Column)。
A=[T(e1) T(e2) … T(en)]
你可能會好奇,為什麼只看 e1,e2 就知道所有向量 x 的變換結果?
這是因為任何向量 x=[x1x2] 都可以寫成基底的組合:x=x1e1+x2e2。如果 T 是線性的,則:
T(x)=T(x1e1+x2e2)=x1T(e1)+x2T(e2)這正好就是矩陣乘法 Ax 的定義!所以,只要掌握了基底的像,我們就掌握了一切。
圖解建構過程
下圖展示了如何透過觀察基底向量的變化來「組裝」出標準矩陣 A。

矩陣 A 的第 j 行 (Column),其實就是第 j 個標準基底向量 ej 經過變換後的結果 T(ej)。
經典範例集錦 (Classic Examples)
這裡我們透過幾個經典範例,來熟悉如何建構標準矩陣。
範例 1:投影變換 (Projection)
題目:設 T:R2→R2 是「投影到 X 軸」的線性變換。求其標準矩陣 A。
解:
- e1=(1,0) 在 X 軸上,投影後不變 ⇒T(e1)=[10]
- e2=(0,1) 在 Y 軸上,投影到 X 軸變原點 ⇒T(e2)=[00]
A=[1000]
現在若想知道 x=(3,5) 投影後的結果,直接計算 Ax=[1000][35]=[30],結果正確(Y 分量被消除了)。
範例 2:已知線性轉換在兩個向量上的值,求其他向量的像
題目:設 T:R2→R2 為一線性轉換,且已知
T[11]=[23],T[1−1]=[4−1].
請回答下列問題:
- 求 T([33])
- 求 T([10]) 與 T([01])
解:
(1) 求 T([33])
觀察向量關係:
[33]=3[11]
因為 T 是線性轉換,滿足齊次性 (Scalar Multiplication):T(cv)=cT(v)。因此:
T([33])=T(3[11])=3T([11])=3[23]=[69]
(2) 求 T([10])
先將 [10] 表成已知向量的線性組合:
[10]=21[11]+21[1−1]
利用線性轉換的可加性 (Additivity) 與齊次性:
T([10])=21T([11])+21T([1−1])=21[23]+21[4−1]=[31]
(3) 求 T([01])
同樣先做向量分解:
[01]=21[11]−21[1−1]
因此:
T([01])=21T([11])−21T([1−1])=21[23]−21[4−1]=[−12]
範例 3:由基底向量求一般向量的線性轉換
題目:承上題,已知:
T([10])=[31],T([01