数学 の線型代数学 の分野におけるシューア分解 (シューアぶんかい、英 : Schur decomposition )あるいはシューア三角化 (Schur triangulation) とは、イサイ・シュール の名にちなむ行列の分解 の一種である。
内容
シュール分解とは、次のようなものである: A を成分が複素数 であるような n × n 正方行列 とする。このとき、A は次のように表現することが出来る[ 1] [ 2] 。
A
=
Q
U
Q
− − -->
1
{\displaystyle A=QUQ^{-1}}
ここで Q はあるユニタリ行列 (したがって、その逆 Q −1 は Q の共役転置 Q * でもある)であり、U は A のシューア標準形 (Schur form) と呼ばれる上三角行列 である。U は A と相似 であるため、それらは等しい固有値 の多重集合 を持つ。また U は三角行列であるため、そのような固有値は U の対角成分で与えられる。
シュール分解は、A -不変部分空間からなる包含列 {0} = V 0 ⊂ V 1 ⊂ ... ⊂ Vn = C n が存在することを意味する。また各 i に対し、初めの i 個の基底ベクトルがその入れ子型の列の V i を張るようなある順序付けられた(C n の標準的なエルミート形式 に対する)正規直交基底 が存在する。また違った言い方をすれば、初めの部分はある複素有限次元ベクトル空間上の線型作用素 が、完全旗 (英語版 ) (V 1 ,...,Vn ) を安定化 することを意味する。
証明
シュール分解の証明は次のようになる。複素有限次元ベクトル空間上のすべての作用素 A は固有値 λ と対応する固有空間 Vλ を持つ。Vλ ⊥ をその固有空間の直交補空間 とする。このとき、その直交分解に関して、A には次のような行列表現が存在することが明らかである(ここで Vλ および Vλ ⊥ を張るような任意の正規直交基底 Z1 および Z2 をそれぞれ選ぶことが出来る)。
[
Z
1
Z
2
]
∗ ∗ -->
A
[
Z
1
Z
2
]
=
[
λ λ -->
I
λ λ -->
A
12
0
A
22
]
: : -->
V
λ λ -->
⊕ ⊕ -->
V
λ λ -->
⊥ ⊥ -->
→ → -->
V
λ λ -->
⊕ ⊕ -->
V
λ λ -->
⊥ ⊥ -->
{\displaystyle {\begin{bmatrix}Z_{1}&Z_{2}\end{bmatrix}}^{*}A{\begin{bmatrix}Z_{1}&Z_{2}\end{bmatrix}}={\begin{bmatrix}\lambda \,I_{\lambda }&A_{12}\\0&A_{22}\end{bmatrix}}\colon {\begin{matrix}V_{\lambda }\\[-1pt]\!\oplus \\[1pt]\,V_{\lambda }^{\perp }\end{matrix}}\to {\begin{matrix}V_{\lambda }\\[-1pt]\!\oplus \\[1pt]\,V_{\lambda }^{\perp }\end{matrix}}}
但し Iλ は Vλ 上の恒等作用素である。この行列は、ブロック行列 A 22 を除いて上三角である。しかしその A 22 も Vλ ⊥ 上の作用素と見なすことで、同様の手順を行ってその部分行列を得ることが出来る。以下、空間 C n に対してこの方法を n 回繰り返せば、求める結果が得られる。
上述の内容はまた、次のように述べることも出来る。λ を A の固有値とし、対応する固有空間を Vλ とする。A は、C n の Vλ を法とする商空間 上のある作用素 T を導く。この作用素はまさしく上述のブロック行列 A 22 である。上述と同様に、T は Vλ を法とするある固有空間 Wμ ⊂ C n を持つ。その商写像の下での Wμ の原像は、Vλ を含むような A の不変部分空間 であることに注意されたい。この手順を、最終的に得られる商空間の次元が 0 になるまで続ける。すると、各手順で見つけられる固有空間の原像の集まりが、A を安定化する旗を構成する。
計算例
次の行列を三角化する。三角化の方法は一意ではないので、ここに示すものはあくまで一例である。
A
=
[
4
− − -->
8
1
1
− − -->
5
1
− − -->
9
8
− − -->
6
]
{\displaystyle A={\begin{bmatrix}4&-8&1\\1&-5&1\\-9&8&-6\end{bmatrix}}}
A の固有値を
λ λ -->
{\displaystyle \lambda }
とすると、固有方程式は
det
(
A
− − -->
λ λ -->
I
3
)
=
0
,
(
λ λ -->
+
5
)
2
(
λ λ -->
− − -->
3
)
=
0
{\displaystyle \det(A-\lambda I_{3})=0,(\lambda +5)^{2}(\lambda -3)=0}
。固有ベクトルをどれでもよいので1つとる。ここでは
λ λ -->
1
=
− − -->
5
{\displaystyle \lambda _{1}=-5}
に対応した
[
1
,
1
,
− − -->
1
]
⊺ ⊺ -->
{\displaystyle {\begin{bmatrix}1,&1,&-1\end{bmatrix}}^{\intercal }}
を選ぶものとする。これ(のスカラー倍)を含むような正規直交基底を、どれでもよいので1つとる。ここでは、
v
1
=
1
3
[
1
1
− − -->
1
]
,
u
=
1
2
[
1
− − -->
1
0
]
,
w
=
1
6
[
− − -->
1
− − -->
1
− − -->
2
]
{\displaystyle {\boldsymbol {v}}_{1}={\frac {1}{\sqrt {3}}}{\begin{bmatrix}1\\1\\-1\end{bmatrix}},{\boldsymbol {u}}={\frac {1}{\sqrt {2}}}{\begin{bmatrix}1\\-1\\0\end{bmatrix}},{\boldsymbol {w}}={\frac {1}{\sqrt {6}}}{\begin{bmatrix}-1\\-1\\-2\end{bmatrix}}}
と選ぶことにする。これらを横に並べて
Q
1
=
[
v
1
→ → -->
u
→ → -->
w
→ → -->
]
{\displaystyle Q_{1}={\begin{bmatrix}{\vec {{\mathbf {v} }_{1}}}&{\vec {\mathbf {u} }}&{\vec {\mathbf {w} }}\end{bmatrix}}}
と3次正方行列を作ると、これはユニタリである。
ここで
Q
1
− − -->
1
A
Q
1
{\displaystyle {Q_{1}}^{-1}AQ_{1}}
の1列目は (1,1) 成分を除いて0である。なぜなら、この行列を単位ベクトル
e
1
→ → -->
=
[
1
0
0
]
{\displaystyle {\vec {{\mathbf {e} }_{1}}}={\begin{bmatrix}1\\0\\0\end{bmatrix}}}
に(左から)掛けることで1列目だけを取り出すと、
Q
1
− − -->
1
A
Q
1
e
1
→ → -->
=
Q
1
− − -->
1
A
v
1
→ → -->
=
λ λ -->
1
Q
1
− − -->
1
v
1
→ → -->
=
λ λ -->
1
Q
1
− − -->
1
Q
1
e
1
→ → -->
=
[
λ λ -->
1
0
0
]
{\displaystyle {Q_{1}}^{-1}AQ_{1}{\vec {{\mathbf {e} }_{1}}}={Q_{1}}^{-1}A{\vec {{\mathbf {v} }_{1}}}=\lambda _{1}{Q_{1}}^{-1}{\vec {{\mathbf {v} }_{1}}}=\lambda _{1}{Q_{1}}^{-1}Q_{1}{\vec {{\mathbf {e} }_{1}}}={\begin{bmatrix}\lambda _{1}\\0\\0\end{bmatrix}}}
実際計算してみると、
Q
1
− − -->
1
A
Q
1
=
[
− − -->
5
35
/
6
− − -->
3
/
2
0
3
0
0
8
/
3
− − -->
5
]
{\displaystyle {Q_{1}}^{-1}AQ_{1}={\begin{bmatrix}-5&35/{\sqrt {6}}&-3/{\sqrt {2}}\\0&3&0\\0&8/{\sqrt {3}}&-5\end{bmatrix}}}
次に、右下の2×2の小行列
A
~ ~ -->
=
[
3
0
8
/
3
− − -->
5
]
{\displaystyle {\tilde {A}}={\begin{bmatrix}3&0\\8/{\sqrt {3}}&-5\end{bmatrix}}}
を全く同様の方法で「1列目が (1,1) 成分を除いて0」にする。例えば、
Q
2
~ ~ -->
=
[
0
1
1
0
]
{\displaystyle {\tilde {Q_{2}}}={\begin{bmatrix}0&1\\1&0\end{bmatrix}}}
のように2次ユニタリ行列がとれる。これを3次行列に「拡大」して、
Q
2
=
[
1
0
0
0
0
Q
2
~ ~ -->
]
,
Q
2
− − -->
1
=
[
1
0
0
0
0
Q
2
~ ~ -->
− − -->
1
]
{\displaystyle Q_{2}={\begin{bmatrix}1&{\begin{matrix}0&0\end{matrix}}\\{\begin{matrix}0\\0\end{matrix}}&{\tilde {Q_{2}}}\end{bmatrix}},{Q_{2}}^{-1}={\begin{bmatrix}1&{\begin{matrix}0&0\end{matrix}}\\{\begin{matrix}0\\0\end{matrix}}&{\tilde {Q_{2}}}^{-1}\end{bmatrix}}}
とすれば、
Q
2
− − -->
1
Q
1
− − -->
1
A
Q
1
Q
2
{\displaystyle {Q_{2}}^{-1}{Q_{1}}^{-1}AQ_{1}Q_{2}}
=
[
1
0
0
0
0
Q
2
~ ~ -->
− − -->
1
]
Q
1
− − -->
1
A
Q
1
[
1
0
0
0
0
Q
2
~ ~ -->
]
=
[
− − -->
5
− − -->
3
/
2
35
/
6
0
0
Q
2
~ ~ -->
− − -->
1
A
~ ~ -->
Q
2
~ ~ -->
]
=
[
− − -->
5
− − -->
3
/
2
35
/
6
0
− − -->
5
8
/
3
0
0
3
]
{\displaystyle {\begin{aligned}&={\begin{bmatrix}1&{\begin{matrix}0&0\end{matrix}}\\{\begin{matrix}0\\0\end{matrix}}&{\tilde {Q_{2}}}^{-1}\end{bmatrix}}{Q_{1}}^{-1}AQ_{1}{\begin{bmatrix}1&{\begin{matrix}0&0\end{matrix}}\\{\begin{matrix}0\\0\end{matrix}}&{\tilde {Q_{2}}}\end{bmatrix}}\\&={\begin{bmatrix}-5&{\begin{matrix}-3/{\sqrt {2}}&35/{\sqrt {6}}\end{matrix}}\\{\begin{matrix}0\\0\end{matrix}}&{\tilde {Q_{2}}}^{-1}{\tilde {A}}{\tilde {Q_{2}}}\end{bmatrix}}={\begin{bmatrix}-5&-3/{\sqrt {2}}&35/{\sqrt {6}}\\0&-5&8/{\sqrt {3}}\\0&0&3\end{bmatrix}}\end{aligned}}}
最後の上三角化行列を U とすれば、ユニタリ行列
Q
:=
Q
1
Q
2
{\displaystyle Q:=Q_{1}Q_{2}}
により
Q
− − -->
1
A
Q
=
U
,
A
=
Q
U
Q
− − -->
1
{\displaystyle Q^{-1}AQ=U,A=QUQ^{-1}}
注釈
すべての正方行列にはシュール分解が存在するが、一般にこの分解は一意でない。どの固有値を選ぶかの順序の選択や、ある固有値の固有空間 Vλ の次元が 1 より大きい場合もありうる。そのような場合であっても Vλ に対応する正規直交基底を任意に選んで操作を行えば分解は成立する。
三角行列 U を U = D + N と表す。ただし D は対角行列で、N は狭義の上三角行列(したがって冪零行列 )である。対角行列 D は A の固有値を任意の順番で含むものである(したがってそのフロベニウスノルムの二乗は A の固有値の絶対値の二乗の和となる。しかし A のフロベニウスノルムの二乗は A の特異値 の二乗の和である)。その冪零の部分 N は一般に一意ではないが、そのフロベニウスノルム は A によって一意に定まる(なぜならば A のフロベニウスノルムは U = D + N のフロベニウスノルムと等しいからである)。
A が正規行列 であるなら、そのシュール分解により得られる U は対角行列 でなくてはならず、Q の列ベクトルは A の固有ベクトル によって構成される。したがってシュール分解はスペクトル分解 を拡張するものである。特に A が正定値 であるなら、そのシュール分解とスペクトル分解および特異値分解 は一致する。
ある可換 な行列の族 {Ai } は同時に三角化出来る。すなわち、あるユニタリ行列 Q が存在して、その与えられた族の任意の Ai に対して Q Ai Q* が上三角行列となる。このことはすでに示した上述の証明より従う。{Ai } のある元 A を選び、再び固有空間 VA を考える。このとき VA は {Ai } 内のすべての行列に対して不変である。したがって {Ai } 内のすべての行列は VA 内のある固有ベクトルを必ず共有する。あとは帰納的に主張が従う。その系として、正規行列の全ての可換な族は同時対角化 可能というものがある。
無限次元の場合、バナッハ空間上のすべての有界作用素 に対して不変部分空間が存在するとは限らない。しかし、任意の正方行列に対する上三角化はコンパクト作用素 に対しては一般化される。複素バナッハ空間上のすべてのコンパクト作用素は、縮小閉部分空間列 (英語版 ) を持つ。
応用
リー理論 (英語版 ) における応用は、次を含む:
一般化シュール分解
与えられた正方行列 A と B に対し、一般化シュール分解 (generalized Schur decomposition)はそれらを
A
=
Q
S
Z
∗ ∗ -->
{\displaystyle A=QSZ^{*}}
および
B
=
Q
T
Z
∗ ∗ -->
{\displaystyle B=QTZ^{*}}
のように分解するものである。ここで Q と Z はユニタリ行列 であり、S と T は上三角行列 である。一般化シュール分解はしばしば QZ 分解 とも呼ばれる[ 3]
[ 4]
。
一般化固有値問題
A
x
=
λ λ -->
B
x
{\displaystyle Ax=\lambda Bx}
(
x
{\displaystyle x}
はゼロでない未知のベクトル)の解である一般化固有値
λ λ -->
{\displaystyle \lambda }
は、S の対角要素をそれに対応する T の対角要素により割った商として計算される。すなわち、行列の対角要素を下付き添え字を使って表すとき、第 i 番目の固有値
λ λ -->
i
{\displaystyle \lambda _{i}}
は
λ λ -->
i
=
S
i
i
/
T
i
i
{\displaystyle \lambda _{i}=S_{ii}/T_{ii}}
として得られる。
注
^ Horn & Johnson 1985 , Section 2.3 and further (p. 79 )
^ Golub & van Loan 1996 , Section 7.7 (Schur Decomposition )
^ Golub & van Loan 1996 , section 7.7 (QZ )
^ Daniel Kressner: "Numerical Methods for General and Structured Eigenvalue Problems", Chap2, Springer, LNCSE-46 (2005).
参考文献
Horn, R.A.; Johnson, C.R. (1985). Matrix Analysis . Cambridge University Press. ISBN 0-521-38632-2
Golub, G.H.; van Loan, C.F. (1996). Matrix Computations (3rd ed.). Johns Hopkins University Press. ISBN 0-8018-5414-8
Schott, James R. (2016). Matrix Analysis for Statistics (3rd ed.). New York: John Wiley & Sons. pp. 175–178. ISBN 978-1-119-09247-6 .
Zvonimir Bujanović, Daniel Kressner and Christian Schröder: "Iterative refinement of Schur decompositions", Numerical Algorithms, vol.92 (2023), pp.247-267. url=https://doi.org/10.1007/s11075-022-01327-6 .