Quod Erat Demonstrandum

2016/07/22

有理函數和矩陣

Filed under: NSS,Pure Mathematics,Teaching,University Mathematics — johnmayhk @ 12:06 下午
Tags:

Core mathematics 介紹過 rational function(有理函數),即形如 \frac{P(x)}{Q(x)} 者(其中 P(x)Q(x) 皆為多項式)。

P(x)Q(x) 皆為線性(linear),即形如 \frac{ax+b}{cx+d} 者,稱之曰 fractional linear function(FLF)。

中四教 function(函數)時,偶談下例,設 f(x)=\frac{ax+b}{cx+d},求 f(f(x))

解之曰

f(f(x))

=\frac{af(x)+b}{cf(x)+d}

=\frac{a\times \frac{ax+b}{cx+d}+b}{c\times \frac{ax+b}{cx+d}+d}

=\frac{(a^2+bc)x+b(a+d)}{c(a+d)x+bc+d^2}

仍舊是 FLF。

現看看 2×2 矩陣(matrix)和 FLF 之關係。

設 M=\left(\begin{array}{rcl}a& b\\c& d\\\end{array}\right),求 M^2

解之曰

M^2

=\left(\begin{array}{rcl}a& b\\c& d\\\end{array}\right)\left(\begin{array}{rcl}a& b\\c& d\\\end{array}\right)

=\left(\begin{array}{rcl}a^2+bc& b(a+d)\\c(a+d)& bc+d^2\\\end{array}\right)

比較一下:

可見函數的係數對應著矩陣的元(entries)。說具體點,

函數 f 對 FLF 的作用,是把係數 a,b,c,d 分別變為 a^2+bc,b(a+d),c(a+d),bc+d^2;而

矩陣 M 對矩陣的作用,是把元 a,b,c,d 分別變為 a^2+bc,b(a+d),c(a+d),bc+d^2,兩個不同的作用,產生相同結果。

所以,推而廣之,欲找 f(f(f\dots f(x))\dots ) (共 nf),記之曰 f^{[n]}(x),可透過尋找 M^n 達成。

但如何尋找 M^n ?

比如 M=\left(\begin{array}{rcl}2& -1\\-1& 2\\\end{array}\right)^n 是甚麼?

又係那句:用 wolframalpha 啦~

http://www.wolframalpha.com/

輸入

{{2,-1},{-1,2}}^n

拍一拍 Enter,得:

於是,若 f(x)=\frac{2x-1}{-x+2},則 f^{[n]}(x)=\frac{(1+3^n)x+(1-3^n)}{(1-3^n)x+(1+3^n)}

其實,修 M2 的同學,應見慣尋找 M^n 的題目,用 wolframalpha,不用 1 秒做完這類長題目~

好了,談回數學,尋找 M^n,通常是透過把矩陣 M 對角化(diagonalize)來達成。

何謂把矩陣 M 對角化?即把 M 寫成

M=PDP^{-1}

當中 D 是形如 \left(\begin{array}{rcl}\lambda_1& 0\\0& \lambda_2\\\end{array}\right) 的對角矩陣(diagonal matrix)。

如何把矩陣 M 對角化?

上網便可,先去

https://www.symbolab.com/solver/matrix-diagonalization-calculator

點擊紅圈那格:

在彈出的小視窗 Select matrix size,用 mouse 揀 2×2 個格子:

輸入矩陣各元,再按紅色的 Go:

得出答案:

M=\left(\begin{array}{rcl}2& -1\\-1& 2\\\end{array}\right)
P=\left(\begin{array}{rcl}-1& 1\\1& 1\\\end{array}\right)
P^{-1}=\left(\begin{array}{rcl}-\frac{1}{2}& \frac{1}{2}\\\frac{1}{2}& \frac{1}{2}\\\end{array}\right)
D=\left(\begin{array}{rcl}3& 0\\0& 1\\\end{array}\right)

修 M2 的同學,有了 M=PDP^{-1},我們便有 M^n=PD^nP^{-1},大家試驗算一下

\left(\begin{array}{rcl}2& -1\\-1& 2\\\end{array}\right)^n=\frac{1}{2}\left(\begin{array}{rcl}1+3^n& 1-3^n\\1-3^n& 1+3^n\\\end{array}\right)

吧。

嗯,真正談回數學,不上網,如何把矩陣 M 對角化?

因為是 M2 程度,我只談 2×2 矩陣,高手見諒。

首先,命

M\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\lambda\left(\begin{array}{rcl}x\\y\\\end{array}\right) ………. (1)

當中的 \lambda 是純量(scalar),即是一個數字。

先停一停,看清楚 (1)。

等號左邊是一個矩陣 M 作用在一支列向量(column vector)\left(\begin{array}{rcl}x\\y\\\end{array}\right) 上,運算是較複雜的矩陣乘法;但右邊卻是簡單的數字乘以矩陣。

當然不是所有列向量 \left(\begin{array}{rcl}x\\y\\\end{array}\right) 都滿足 (1),但肯定存在一支可以,就是 \left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)

但這是無聊的,我們希望有支非零的列向量 \left(\begin{array}{rcl}x\\y\\\end{array}\right) 滿足 (1),即使到 M 作用在這支列向量 \left(\begin{array}{rcl}x\\y\\\end{array}\right) 上的效果,相當於 \lambda 乘以 \left(\begin{array}{rcl}x\\y\\\end{array}\right)

要有非零的 \left(\begin{array}{rcl}x\\y\\\end{array}\right) 滿足 (1),即

要有非零的 \left(\begin{array}{rcl}x\\y\\\end{array}\right) 滿足

M\left(\begin{array}{rcl}x\\y\\\end{array}\right)-\lambda\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)

\Rightarrow M\left(\begin{array}{rcl}x\\y\\\end{array}\right)-\lambda I\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)

\Rightarrow (M-\lambda I)\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right) ………. (2)

即線性方程組 (2) 有非平凡解(non-trivial solution),故 \Delta =0,亦即 |M-\lambda I|=0

現在代入 M=\left(\begin{array}{rcl}a& b\\c& d\\\end{array}\right),得

|\left(\begin{array}{rcl}a& b\\c& d\\\end{array}\right)-\left(\begin{array}{rcl}\lambda & 0\\0& \lambda\\\end{array}\right)|=0

\Rightarrow (a-\lambda)(d-\lambda)-bc=0

\Rightarrow \lambda^2-(a+d)\lambda+(ad-bc)=0 ………. (3)

上式稱為對應 M 的特徵方程(characteristics equation),它的根(roots)被稱為 M 的特徵值(eigenvalues)。

因 (3) 是二次方程,設其根(特徵值)為 \lambda_1,\lambda_2

\lambda=\lambda_1 代入 (1),得方程

M\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\lambda_1\left(\begin{array}{rcl}x\\y\\\end{array}\right)

解出非平凡解(非零解)\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right),即

M\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)=\lambda_1\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right) ………. (4)

\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)M 對應 \lambda_1 的特徵向量(eigenvector of M corresponding to \lambda_1

類似地,把 \lambda=\lambda_2 代入 (1),解得非零解 \left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right),即

M\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\lambda_2\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right) ………. (5)

\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)M 對應 \lambda_2 的特徵向量(eigenvector of M corresponding to \lambda_2

把 (4) 和 (5) 略略作些變化,把所有東西變作 2x2 矩陣,即

M\left(\begin{array}{rcl}x_1& 0\\y_1& 0\\\end{array}\right)=\lambda_1\left(\begin{array}{rcl}x_1& 0\\y_1& 0\\\end{array}\right)=\left(\begin{array}{rcl}\lambda_1x_1& 0\\\lambda_1y_1& 0\\\end{array}\right) ………. (6)

M\left(\begin{array}{rcl}0& x_2\\0& y_2\\\end{array}\right)=\lambda_2\left(\begin{array}{rcl}0& x_2\\0& y_2\\\end{array}\right)=\left(\begin{array}{rcl}0& \lambda_2x_2\\0& \lambda_2y_2\\\end{array}\right) ………. (7)

(6)+(7) 得

M\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)=\left(\begin{array}{rcl}\lambda_1x_1& \lambda_2x_2\\\lambda_1y_1& \lambda_2y_2\\\end{array}\right)=\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)\left(\begin{array}{rcl}\lambda_1& 0\\0& \lambda_2\\\end{array}\right)

之後,最希望把上式進一步寫成:

M=\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)\left(\begin{array}{rcl}\lambda_1& 0\\0& \lambda_2\\\end{array}\right)\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)^{-1}

便完成把 M 對角化過程。問題是,\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)^{-1} 存在嗎?

原來,若 \lambda_1\neq \lambda_2,則 \left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)^{-1} 存在。

解說:

要證明 \left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)^{-1} 存在,

即證明 \det\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)\ne 0

亦即證明以下方程組

\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)\left(\begin{array}{rcl}\alpha\\\beta\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)

只有唯一解 \left(\begin{array}{rcl}\alpha\\\beta\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)

把上述方程組寫成

\alpha\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)+\beta\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right) ………. (8)

等號兩邊同時左乘 M,即

M(\alpha\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)+\beta\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right))=M\left(\begin{array}{rcl}0\\0\\\end{array}\right)

\alpha M\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)+\beta M\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)

\alpha \lambda_1\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)+\beta \lambda_2\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right) ………. (9)

把 (8) 式等號兩邊同時乘以 \lambda_1,得

\alpha \lambda_1\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)+\beta \lambda_1\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right) ………. (10)

(9)-(10) 得

\beta (\lambda_2-\lambda_1)\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)

由於 \left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right) 是非零矩陣,且 \lambda_1 \ne \lambda_2,故推得 \beta =0

\beta =0 代入 (8),由於 \left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right) 是非零矩陣,得 \alpha =0

故此,方程組 \left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)\left(\begin{array}{rcl}\alpha\\\beta\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right) 只有唯一解 \left(\begin{array}{rcl}\alpha\\\beta\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right),從而  \left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)^{-1} 存在。

我們才敢說 M=\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)\left(\begin{array}{rcl}\lambda_1& 0\\0& \lambda_2\\\end{array}\right)\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)^{-1}

好了,先總結一下對角化程序:

步驟 1:解特徵方程 |M-\lambda I|=0,得出特徵值 \lambda_1,\lambda_2。(其中 \lambda_1\ne\lambda_2
步驟 2:把 \lambda_1,\lambda_2 分別代入方程組 (1),解出特徵向量 \left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)
步驟 3:把 M 對角化為  M=\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)\left(\begin{array}{rcl}\lambda_1& 0\\0& \lambda_2\\\end{array}\right)\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)^{-1}

e.g.1

M=\left(\begin{array}{rcl}2& -1\\-1& 2\\\end{array}\right)

步驟 1:

\left|\begin{array}{rcl}2-\lambda & -1\\-1& 2-\lambda \\\end{array}\right|=0\Rightarrow \lambda =3,1

步驟 2:

\lambda =3,(1) 變為 \left(\begin{array}{rcl}2-3& -1\\-1& 2-3\\\end{array}\right)\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)

x+y=0,可知 \left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}-t\\t\\\end{array}\right),其中 t\in \mathbb{R}

取 \left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)=\left(\begin{array}{rcl}-1\\1\\\end{array}\right)。(為何可隨意取 t 值?)

\lambda =1,(1) 變為 \left(\begin{array}{rcl}2-1& -1\\-1& 2-1\\\end{array}\right)\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)

x-y=0,可知 \left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}t\\t\\\end{array}\right),其中 t\in \mathbb{R}

\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\left(\begin{array}{rcl}1\\1\\\end{array}\right)

步驟 3:

\left(\begin{array}{rcl}2& -1\\-1& 2\\\end{array}\right)=\left(\begin{array}{rcl}-1& 1\\1& 1\\\end{array}\right)\left(\begin{array}{rcl}3& 0\\0& 1\\\end{array}\right)\left(\begin{array}{rcl}-1& 1\\1& 1\\\end{array}\right)^{-1}

e.g.2

M=\left(\begin{array}{rcl}3& -2\\4& -1\\\end{array}\right)

步驟 1:

\left|\begin{array}{rcl}3-\lambda & -2\\4& -1-\lambda \\\end{array}\right|=0\Rightarrow \lambda =1\pm 2i

步驟 2:

\lambda =1+2i,(1) 變為 \left(\begin{array}{rcl}3-1-2i& -2\\4& 2-1-2i\\\end{array}\right)\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)

\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)=\left(\begin{array}{rcl}1\\1-i\\\end{array}\right)

\lambda =1-2i,(1) 變為 \left(\begin{array}{rcl}3-1+2i& -2\\4& 2-1+2i\\\end{array}\right)\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)

\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\left(\begin{array}{rcl}1\\1+i\\\end{array}\right)

步驟 3:

\left(\begin{array}{rcl}3& -2\\4& -1\\\end{array}\right)=\left(\begin{array}{rcl}1& 1\\1-i& 1+i\\\end{array}\right)\left(\begin{array}{rcl}1+2i& 0\\0& 1-2i\\\end{array}\right)\left(\begin{array}{rcl}1& 1\\1-i& 1+i\\\end{array}\right)^{-1}

注意,\left(\begin{array}{rcl}3& -2\\4& -1\\\end{array}\right)^n 的元不可能出現非實數(unreal numbers),讓我進一步化簡看看。

\left(\begin{array}{rcl}1& 1\\1-i& 1+i\\\end{array}\right)^{-1}=\frac{1}{1+i-1+i}\left(\begin{array}{rcl}1+i& -(1-i)\\-1& 1\\\end{array}\right)^T=\frac{1}{2}\left(\begin{array}{rcl}1-i& 1\\1+i& -i\\\end{array}\right)

\left(\begin{array}{rcl}3& -2\\4& -1\\\end{array}\right)^n

=\frac{1}{2}\left(\begin{array}{rcl}1& 1\\1-i& 1+i\\\end{array}\right)\left(\begin{array}{rcl}(1+2i)^n& 0\\0& (1-2i)^n\\\end{array}\right)\left(\begin{array}{rcl}1-i& i\\1+i& -i\\\end{array}\right)

以下,對一般 M2 同學要「行人止步」了,因為將要利用 pure mathematics 課程內學的 De Moivre’s formula,見諒。

把上式矩陣內的複數寫作 polar form,即

1+i=cis\frac{\pi}{4}
1-i=cis(-\frac{\pi}{4})
1+2i=\sqrt{5}cis\theta
1-2i=\sqrt{5}(-cis\theta)

其中 \theta=\tan^{-1}(2)

由 De Moivre’s formula,得

(1+2i)^n=\sqrt{5^n}cis(n\theta)
(1-2i)^n=\sqrt{5^n}cis(-n\theta)

於是,

\left(\begin{array}{rcl}3& -2\\4& -1\\\end{array}\right)^n

=\frac{1}{2}\left(\begin{array}{rcl}\sqrt{5^n}cis(n\theta)& \sqrt{5^n}cis(-n\theta)\\\sqrt{2\cdot 5^n}cis(n\theta-\frac{\pi}{4})& \sqrt{2\cdot 5^n}cis(n\theta+\frac{\pi}{4})\\\end{array}\right)\left(\begin{array}{rcl}1-i& i\\1+i& -i\\\end{array}\right)

=\left(\begin{array}{rcl}\sqrt{2\cdot 5^n}\cos(n\theta-\frac{\pi}{4})& -\sqrt{5^n}\sin(n\theta)\\2\sqrt{5^n}\sin(n\theta)& -\sqrt{2\cdot 5^n}\sin(n\theta-\frac{\pi}{4})\\\end{array}\right)

於是,若 f(x)=\frac{3x-2}{4x-1},則 f^{[n]}(x)=\frac{\sqrt{2\cdot 5^n}\cos(n\theta-\frac{\pi}{4})x-\sqrt{5^n}\sin(n\theta)}{2\sqrt{5^n}\sin(n\theta)x-\sqrt{2\cdot 5^n}\sin(n\theta-\frac{\pi}{4})},其中 \theta=\tan^{-1}(2)

後話

1. 一些矩陣會出現 M^m=kM 的情況,對應的 FLF 就是周期性(periodic),例如 \left(\begin{array}{rcl}1& 1\\2& -1\\\end{array}\right)^3=3\left(\begin{array}{rcl}1& 1\\2& -1\\\end{array}\right),故 f^{[3]}(x)\equiv f(x),其中 f(x)=\frac{x+1}{2x-1}

2. 對一般的 nxn 矩陣 M,若其特徵值各異(distinct),則它必能被對角化,從而找到 M^n

3. 當 M 的特徵值並非各異,M 仍有可能被對角化。

4. 就算 M 不能被對角化,我們當然仍可找 M^n

5. M2 不似 pure mathematics 課程,沒有強調矩陣乘法對應線性變換,故學生大抵不清楚有關特徵向量的圖像意義。

習題

1. 設 f(x)=\frac{x+2}{x+3},求 f^{[n]}(x)

2. 設 f(x)=\frac{2x-1}{x+4},求 f^{[n]}(x)

3. 已知 \left \{ \begin{array}{ll} \frac{dx}{dt}=ax+by\\\frac{dy}{dt}=cx+dy\end{array}\right.。證明 A\frac{d^2x}{dt^2}+B\frac{dx}{dt}+Cx=0,其中 A,B,C 是常數。比較上述式子與 M=\left(\begin{array}{rcl}a& b\\c& d\\\end{array}\right) 的特徵方程,有甚麼發現?

懷古

本科第一年必修的線性代數(linear algebra)課,對於剛完成中七程度純數學的我,甚感吃力,因為先要讀通以下基礎知識(圖可點擊放大):

才開始 Chapter 1 的 Vector space;Chapter 2 的 Linear mappings…不知現在的線性代課課會否如此佈置?

多貼上學期的考試:



由 Zorn’s lemma 出發,到 Chapter 1 有應用了:

偶見 note 上的草草字體,相信當時讀到我燥底:

無論如何,感謝當年這門基礎課的講師,已過身的黃友川教授,記得他經常說的:呢步 trivial 啦…對於教授來說,肯肯定的說。

網上找來一篇懷古:http://www.alumni.cuhk.edu.hk/magazine/sep96/html/P28-29.HTM 再見了,遙遠的數學知識~

發表迴響 »

仍無迴響。

RSS feed for comments on this post. TrackBack URI

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 變更 )

Twitter picture

You are commenting using your Twitter account. Log Out / 變更 )

Facebook照片

You are commenting using your Facebook account. Log Out / 變更 )

Google+ photo

You are commenting using your Google+ account. Log Out / 變更 )

連結到 %s

在 WordPress.com 建立免費網站或網誌.

%d 位部落客按了讚: