2015年3月29日 星期日

李娘二姊不辣:矩陣大家族 The Family of Matrices

數學家把數字擺成棋盤那樣的二維陣列後,矩陣(Matrix)就跑出來了。更可怕的是,數學家給這些排列賦予了一大堆性質,等於是把矩陣玩過一遍。


如果矩陣是個小女孩數學家們替一大堆矩陣取了名字,不過可不是阿珠阿花還是JohnPaul之類的菜市場名。有時候某些名字聽起來真的像是「屁怒流(へどる)」這種很炫泡卻又讓人摸不著頭緒的名稱。

底下給出的是一些矩陣類型,算是對各種矩陣的入門。更深入的研究可參考其他資料或是我將會放在網誌上。

零矩陣 Zero Matrix


零矩陣(又稱空矩陣,Null Matrix)可說是最最簡單的矩陣。這類矩陣並不需要什麼太花俏的條件,只要一句「元素都是零」就解決了。

零矩陣的大小沒有特別限制,一個3×2的零矩陣(三列二行)被記做O3,2,而3×3的零矩陣被簡記為O3

零矩陣在矩陣運算中如同加法單位元(Additive Identity)一樣基本(也常被忽略)。對於任一矩陣A,有以下運算性質:



單位矩陣 Identity Matrix


單位矩陣可說是最基本的矩陣之一。要滿足單位矩陣的條件多了些,不過用一句話來說就是「主對角線(Main Diagonal)上的元素都是一的方陣(Square Matrix)。」

雖然名為單位矩陣,但他是作為矩陣乘法的單位元(Multiplicative Identity)的。因此有以下性質:



冪零矩陣 Nilpotent Matrix


考慮一個數,如果他的平方或立方等於零的話,我們通常會考慮這個數本身就是零了。但是在矩陣的世界中,存在著一種矩陣,其平方、立方或高次方等於零矩陣,儘管本身不為零矩陣。這完完全全地顛覆了我們的思想!!!!!!

所謂冪零元(Nilpotent)指的是在某一環中的數x,若且唯若存在一正整數n,使得xn等於加法零元素。在實數中的冪零元是0,而矩陣的冪零元則是冪零矩陣。


上面給出的例子中有較多的零在裡面,而且主對角線上的元素是零(主對角線為零的上下三角矩陣,或嚴格上下三角矩陣,都是冪零矩陣)。但實際上有的冪零矩陣可以不包含任何零在裡面,比如下面這個2×2的矩陣:


更精確地說,一個矩陣若且唯若特徵值全為零,則他就是冪零矩陣。附帶的性質就是行列式為零,跡亦為零。若一個矩陣的特徵方程式可寫為下列形式:


則有:


如果特徵值只有零這個解的話,那就是以外的項都要為零,常數亦為零。所以跡為零,行列式亦為零。


冪等矩陣 Idempotent Matrix


和冪零矩陣不同的是,冪等矩陣無論乘上自己多少次都不會等於其他東西,而永遠是自己。相對於冪零矩陣,冪等矩陣有個不太一樣的寫法:



對角矩陣 Diagonal Matrix


對角矩陣是一個簡單的矩陣。該矩陣內部的元素滿足下列條件:主對角線以外的元素皆為零。而主對角線上的元素也可以為零,這情況和上述條件不衝突。

依照這個定義,零矩陣和單位矩陣都是對角矩陣。


三角矩陣 Trianglular Matrix


三角矩陣之所以會被冠以該名稱是源自於內部的元素排列狀況,就像一個三角形。三角矩陣底下分上三角矩陣(Upper Triangular Matrix)及下三角矩陣(Lower Triangular Matrix),根據矩陣內零的位置而定。左下部的元素為零者稱為上三角矩陣,右上部的元素為零者稱為下三角矩陣。對角矩陣因為主對角線以外的元素都是零,因此同時符合上下三角矩陣的定義。

此外,還有更「嚴格定義」的三角矩陣。一個嚴格三角矩陣(Strictly Triangular Matrix)的主對角線上所有元素必須是要零。因此一個嚴格三角矩陣同時也是冪零矩陣。


對稱矩陣 Symmetric Matrix


矩陣說要對稱可不是那麼容易較可以對稱的。要獲得「對稱矩陣」的稱號,一個矩陣的內部元素必須要以主對角線(Main Diagonal)為對稱軸對稱。也就是說:


比如說,a35要等於a53,而a18要等於a81。位於主對角線上的元素由於所在行列數相同,因此主對角線上的元素可以是任何數字而不受限制。而對稱的性質則體現在其轉置矩陣上,有:


要是你不知道轉置是什麼步驟,可以參考這篇,順便認識共軛矩陣


反對稱矩陣 Antisymmetric Matrix


反對稱矩陣(又稱斜對稱矩陣,Skew-symmetric Matrix)可不是反對的那種反,而是差了一個負號的反。


乍看之下一個反對稱矩陣看起來跟對稱矩陣一樣,及元素都以主對角線為對稱軸。但是反對稱矩陣裡主對角線一邊的元素和另外一邊差了一個負號,而主對角線上的元素也必須要遵守「自己是自己的加法逆元」這一條件而變成了0。反對稱的性質體現在轉置矩陣上的是:


若給定一個矩陣A,則他和其轉置矩陣的和必為對稱矩陣,他和其轉置矩陣的差必為反對稱矩陣。這也同時表示了一個對稱矩陣可以表示為A+AT,一個反對稱矩陣則為A-AT,A為任意矩陣,上述兩個狀況中的A可以一樣。


埃爾米特矩陣 Hermitian Matrix


埃爾米特矩陣(或譯厄米特矩陣)比較像是對稱矩陣的共軛版本。也就是說,一個埃爾米特矩陣會和他的轉置矩陣共軛,並同時滿足一個看起來跟上面很像的條件:


「埃爾米特」這個名稱源自於一位法國科學家Charles Hermite(H不發音),是因為他證明了一個埃爾米特矩陣的特徵值仍是實數。

除此之外,埃爾米特矩陣還有幾個很有趣的性質:
  1. A為埃爾米特矩陣,則  亦為埃爾米特矩陣。
  2. A同上,若一向量 ,則 
  3. 一埃爾米特矩陣其特徵向量正交。
  4. 一埃爾米特矩陣其特徵值之幾何重數等於代數重數。


反埃爾米特矩陣 Antihermitian Matrix


埃爾米特矩陣加了個反字,就代表他要差一個負號了。一個很有趣的現象是一個元素的虛部因為共軛和負號的關係而抵銷了,看不出來有什麼改變,改變的反而是實部。


繼承了反對稱矩陣的性質,反埃爾米特矩陣的主對角元仍然是零。


正交矩陣 Orthogonal Matrix


就像向量可以具正交性(Orthogonality)一樣,矩陣在矩陣乘法的定義上也存在正交的矩陣。儘管向量的正交性是建立在內積上(兩者內積為零),矩陣的正交性定義為:


兩個正交的矩陣相乘必須為單位矩陣,而非零矩陣。很有趣的一點是一個正交矩陣的列向量們(或行向量們)卻會互相正交(內積為零)。

正交矩陣最著名的成員就是旋轉矩陣(Rotation Matrix),作用在一向量上時,不改變其長度,僅改變其角度。正交矩陣的其中一個性質就是不改變作用上的向量長度,所以即使兩個向量皆受某一正交矩陣變換,其內積仍然不變。


其中Ω為正交方陣。

同時正交矩陣也不改變矩陣乘積中被乘矩陣的行列式(或差個負號)。換句換說,正交矩陣的行列式為


正交矩陣不一定要是方陣,因為非方陣和自身轉置矩陣的乘積一定是方陣。但是作用在向量上的變換一定要是方陣。


酉矩陣 Unitary Matrix

酉矩陣(或譯么正矩陣)是正交矩陣在複數遇上的推廣,許多正交矩陣的性質也都繼承了下來。

酉矩陣其實並不常出現在普通矩陣運算中,他比較活躍的地方在於矩陣分解(Matrix Decomposition),也就是把矩陣拆成數個矩陣的乘積。QR分解和奇異值分解都可以看見酉矩陣(雖然在某些情況下他們會退化成正交矩陣就是了)。


正規矩陣 Normal Matrix


正規矩陣(譯作正常矩陣)是一種很特殊的矩陣,在矩陣乘法中它滿足了其他矩陣都稱羨的性質:交換律(Commutativity)。任何的酉矩陣、埃爾米特矩陣及反埃爾米特矩陣都是正規矩陣,而在沒有複數牽涉的狀況下則是正交矩陣、對稱矩陣和反對稱矩陣。



正規矩陣在矩陣分解中(如譜定理)佔很重要的一環。


可對角化矩陣 Diagonalizable Matrix


這是惡意賣萌,矩陣也會賣萌可對角化矩陣是特徵分析(Eigenanalysis)中最重要的主角,許多動作都必須符合可對角化的條件才能進行,例如特徵分解(Eigendecomposition)。

可對角化矩陣可以扯到許多東西,在這裡無法好好敘述。該是時間前往下一站——特徵分解了!



參考資料:

  • https://ccjou.wordpress.com/2009/07/29/%E7%89%B9%E6%AE%8A%E7%9F%A9%E9%99%A3-%E4%B8%80%EF%BC%9A%E5%86%AA%E9%9B%B6%E7%9F%A9%E9%99%A3/
  • https://ccjou.wordpress.com/2010/01/05/%E7%89%B9%E6%AE%8A%E7%9F%A9%E9%99%A3-%E4%B9%9D%EF%BC%9A-hermitian-%E7%9F%A9%E9%99%A3/
  • http://zh.wikipedia.org/wiki/%E6%AD%A3%E8%A7%84%E7%9F%A9%E9%98%B5
  • https://ccjou.wordpress.com/2009/09/29/%E7%89%B9%E6%AE%8A%E7%9F%A9%E9%99%A3-%E4%BA%94%EF%BC%9A%E5%86%AA%E7%AD%89%E7%9F%A9%E9%99%A3/
  • 及其他



LaTeX語法:


\begin{align*}
p(\lambda)&=\lambda^n-\lambda^{n-1}\sum_{i=1}^n\lambda_i+\cdots+(-1)^n\prod_{i=1}^n\lambda_i\\
 &= \lambda^n-\mathrm{tr}(\mathbf{A}) \lambda^{n-1}+\cdots+(-1)^n\det(\mathbf{A}) \\
 &= 0
\end{align*}


\textup{A}=\left [ a_{ij} \right ]_{m\times n}\text{is Hermitian}\Leftrightarrow 1\leq i\leq m, \;\; 1\leq j \leq n, \;\; a_{ij}=\overline{a_{ji}}


\mathbf{A} \text{ is orthogonal}\Leftrightarrow \mathbf{AA}^{\!\mathrm{T}}=\mathbf{I}


\det\left (\mathbf{M} \right )^2=\det\left (\mathbf{M} \right )\det \left ( \mathbf{M}^{\mathrm{T}} \right )=\det\left (\mathbf{MM}^{\mathrm{T}} \right )=\det\left (\mathbf{I} \right )=1


\left \langle \boldsymbol{\Omega}\mathbf{x},\boldsymbol{\Omega}\mathbf{y} \right \rangle=\left \langle \mathbf{x}, \mathbf{y} \right \rangle

沒有留言:

張貼留言