- 対角化の操作は,基底の変換(座標変換)に相当する.
- 行列の対角化の公式を「行列表示」の考え方で簡単に導く.
対角行列
定義
A=\begin{pmatrix}
a_{11} & 0 & \cdots & 0 \\
0 & a_{22} & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & a_{nn}
\end{pmatrix}
\end{aligned}
性質
対角行列$A$の$k$乗はA^{k}
=\begin{pmatrix}
(a_{11})^{k} & 0 & \cdots & 0 \\
0 & (a_{22})^{k} & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & (a_{nn})^{k}
\end{pmatrix}
\end{aligned}
対角化
対角化とは?
B=P^{-1} A P
\end{aligned}
但し,どんな行列でも対角化が可能なわけではありません.
なぜ必要?
対角化をしたい理由はいくつかあります.まず,もとの行列$A$の$k$乗が簡単に計算できることです.行列$A$が
B&=P^{-1} A P \\
&=\begin{pmatrix}
\lambda_{1} & 0 & \cdots & 0 \\
0 & \lambda_{2}& \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & \lambda_{n}
\end{pmatrix}
\end{aligned}
B^{k}
&=\begin{pmatrix}
(\lambda_{1})^{k} & 0 & \cdots & 0 \\
0 & (\lambda_{2})^{k} & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & (\lambda_{n})^{k}
\end{pmatrix}
\end{aligned}
B^{k}
&=\overbrace{(P^{-1} A P) (P^{-1} A P) (P^{-1} A P) \cdots (P^{-1} A P)}^{k} \\
&=P^{-1} A (PP^{-1}) A (PP^{-1}) \cdots (PP^{-1}) A P \\
&=P^{-1} A^{k} P
\end{aligned}
A^{k}
&=P
\begin{pmatrix}
(\lambda_{1})^{k} & 0 & \cdots & 0 \\
0 & (\lambda_{2})^{k} & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & (\lambda_{n})^{k}
\end{pmatrix} P^{-1}
\end{aligned}
$P^{-1}AP$の意味は?
対角化の際の$P^{-1}AP$の形は,どこからくるのでしょうか?これは,対角化が「ベクトルの基底の変換(座標変換)」を行っていることに由来します.つまり,
A \mapsto A^{\prime} = P^{-1} A P
\end{aligned}
まず,『行列$A$は,「ベクトル$\boldsymbol{x}$」を「ベクトル$\boldsymbol{y}=A\boldsymbol{x}$」に写す写像である』ことを思い出しましょう.
ここで,全てのベクトル$\boldsymbol{v}$を$\boldsymbol{v}^{\prime}=P^{-1}\boldsymbol{v}$に写すような座標変換を行ったとき,行列$A$がどう変換されるかを考えます(【注】$P$ではなく$P^{-1}$を使う理由は最後に触れます).
行列$A$を座標変換して得られた行列$A^{\prime}$は,$\boldsymbol{x}^{\prime}=P^{-1}\boldsymbol{x}$を$\boldsymbol{y}^{\prime}=P^{-1}\boldsymbol{y}$に写すので
関係式 | |
---|---|
座標変換前 | $\boldsymbol{y}=A\boldsymbol{x}$ |
座標変換後 | \begin{aligned}& \boldsymbol{y}^{\prime}=A^{\prime}\boldsymbol{x}^{\prime} \\ &\Leftrightarrow (P^{-1}\boldsymbol{y})=A^{\prime}(P^{-1}\boldsymbol{x})\end{aligned} |
表中の2つの関係式から
P^{-1}A\boldsymbol{x}
=A^{\prime} P^{-1}\boldsymbol{x}
\end{aligned}
A^{\prime}=P^{-1}AP
\end{aligned}
以上から,対角化は「ベクトルの基底の変換(座標変換)によって,行列を変換する操作」であることがわかりました.
基底の変換を$P$で定めると,ベクトルは$P^{-1}$で変換されることになるためです.例えば,座標回転で座標軸(基底)を$\theta$回転させると,ベクトルは$-\theta$回転することになることをイメージしてください(参考:座標軸の回転と変換則 - Notes_JP).
詳しく言うと,基底$\{\boldsymbol{e}_{1},...,\boldsymbol{e}_{n}\}$から基底$\{\boldsymbol{e}^{\prime}_{1},...,\boldsymbol{e}^{\prime}_{n}\}$への変換を$P=(p_{ij})$を用いて
\boldsymbol{e}^{\prime}_{i}
&=\sum_{j=1}^{n} p_{ji} \boldsymbol{e}_{j}
\end{aligned}
\boldsymbol{v}
=\sum_{i=1}^{n}v_{i} \boldsymbol{e}_{i}
=\sum_{i=1}^{n}v^{\prime}_{i} \boldsymbol{e}^{\prime}_{i}
\end{aligned}
\begin{pmatrix}
v^{\prime}_{1}\\
\vdots \\
v^{\prime}_{n}
\end{pmatrix}
=P^{-1}
\begin{pmatrix}
v_{1}\\
\vdots \\
v_{n}
\end{pmatrix}
\end{aligned}
\boldsymbol{v}
&=\sum_{i=1}^{n}v_{i} \boldsymbol{e}_{i} \\
\boldsymbol{v}
&=\sum_{i=1}^{n}v^{\prime}_{i}
\underset
{\substack{|| \\ \\ \!\!\!\! \mathrlap{\sum_{j=1}^{n} p_{ji} \boldsymbol{e}_{j}}}}
{\boldsymbol{e}^{\prime}_{i}}
= \sum_{j=1}^{n} \biggl(\sum_{i=1}^{n} p_{ji}v^{\prime}_{i}\biggr) \boldsymbol{e}_{j}
\end{aligned}
行列表示によるアプローチ
行列表示を学ぶと,対角化が「基底を取り直す」操作であることが理解できます.対角化とは,
- 行列$\hat{M}$の基底を上手く取り直し,
- 上手くとった基底で$\hat{M}$を行列表示し直す(これを以下$M$で表す)ことにより,
- 対角行列にしてしまおう!
それでは,「基底を上手く取り直す」とは具体的にどういうことなのか,以下で詳しく見てみましょう(「$\hat{}$」の付け方を行列表示の記事と対応をさせました.混乱した時は2つの記事を比較してみて下さい).
対角行列であるための条件
1. 基底が単位ベクトル$\{e_1,...,e_n\}$の場合「行列$M$」と「$i$成分が1の単位ベクトル$e_i$」の間には
M=(Me_1,...,Me_n)
\end{aligned}
M=
\begin{pmatrix}
\lambda_1 &0 & \cdots & 0\\
0 &\lambda_2&\cdots& 0 \\
\vdots & \ddots & \ddots & \\
0 & \cdots& 0 & \lambda_n
\end{pmatrix}
\tag{1}
% \label{eq:diag_M}
\end{aligned}
M e_i=\lambda_i e_i
\tag{2}
% \label{eq:diag}
\end{aligned}
2. 基底がベクトル$\{x_1,...,x_n\}$の場合
一方で,$\hat{M}$の基底$\{x_1,...,x_n\}$に関する行列表示とは,$x_i$を$e_i$だと思ったときに$\hat{M}$を行列として表したものでした.よって「$\hat{M}$の行列表示$M$が式(1)での対角行列となる」必要十分条件は,式(2)で$e_i\rightarrow x_i$とすればよく,
\hat{M} x_i=\lambda_i x_i
\tag{3}
% \label{eq:diag2}
\end{aligned}
従って,式(3)が『$\{x_1,...,x_n\}$が上手い(対角化できる)基底であるための条件式』というわけです.これは正に,対角行列を求める際に現れる式ですね.
対角行列の求め方
「もとの行列$\hat{M}$と対角行列$M$の関係」がわかれば,対角行列の求め方がわかったことになります.$e_i\rightarrow x_i$で定められる行列を$P$で表しましょう.つまり,
Pe_i=x_i
\end{aligned}
P^{-1}\hat{M} P e_i
&=\lambda_i e_i \\
&=Me_i
\end{aligned}
ここまでの結果をまとめましょう:
P^{-1}\hat{M} P
=
\begin{pmatrix}
\lambda_1 &0 & \cdots & 0\\
0 &\lambda_2&\cdots& 0 \\
\vdots & \ddots & \ddots & \\
0 & \cdots& 0 & \lambda_n
\end{pmatrix}
=M
\end{aligned}
\hat{M} x_i=\lambda_i x_i
\end{aligned}
これはまさに,対角行列を求めるおなじみの式です.
参考文献
- [1]線形代数の世界―抽象数学の入り口 (斎藤 毅):$\S 2.3$ 行列表示