擬似逆行列の基本
mathlinear-algebraundergraduatelecture
導入
この講義で重要なのは、擬似逆行列は、逆行列が存在しない行列に対しても、最小二乗解と最小ノルム解を統一的に与える道具であるということである。
逆行列は正方行列で、しかも情報を失わない場合にだけ存在する。しかし、長方行列や階数落ちの行列においても、近似解や代表解を必要とする状況は多い。擬似逆行列は、その状況を線型代数の言葉で処理する。
用語と定義
ムーア・ペンローズ擬似逆行列 とは、行列 A の特異値分解から定義される行列である。実行列では
A=U\Sigma V^T
に対して
A^+=V\Sigma^+U^T
で定義する。複素行列では
A=U\Sigma V^*
に対して
A^+=V\Sigma^+U^*
で定義する。ここで \Sigma^+ は、\Sigma の非零特異値 \sigma_i を 1/\sigma_i に置換し、転置した形の行列である。
方針
方針は、特異値分解により行列の作用を直交変換と伸縮へ分解し、非零の伸縮方向だけを反転することである。零特異値の方向は情報が消失するため、逆変換を定義しない。
data/lecture/math/linear-algebra/特異値分解の入口-講義.n.md
直感的な説明
擬似逆行列は、可能な範囲で逆向きの操作を実行する行列である。
A がある方向を 3 倍するなら、A^+ はその方向を 1/3 倍する。A がある方向を 0 に潰すなら、その情報は復元不能であるため、A^+ はその方向を復元しない。
厳密な説明
1. 正則行列では逆行列に一致する
A が正則なら、すべての特異値が正である。この場合、\Sigma^+ は \Sigma^{-1} に一致し、
A^+=A^{-1}
である。擬似逆行列は逆行列の拡張である。
2. 最小二乗解
連立一次方程式
Ax=b
が解を持たない場合、A^+b は
\|Ax-b\|
を最小化する解のうち、ノルムが最小のものを与える。
\boxed{x=A^+b}
3. 階数条件による公式
A の列が一次独立なら、
A^+=(A^TA)^{-1}A^T
である。これは正規方程式から得られる最小二乗公式である。
A の行が一次独立なら、
A^+=A^T(AA^T)^{-1}
である。この場合は、解が複数存在するときに最小ノルム解を選択する。
複素の場合は、これらの式の A^T を A^* に置換する。列が一次独立なら
A^+=(A^*A)^{-1}A^*
であり、行が一次独立なら
A^+=A^*(AA^*)^{-1}
である。
4. ペンローズの 4 条件
擬似逆行列は SVD による構成だけでなく、次の 4 条件によって一意に特徴づけられる。
AA^+A=A
A^+AA^+=A^+
(AA^+)^*=AA^+
(A^+A)^*=A^+A
これらをペンローズの条件という。前半 2 式は「可能な範囲で逆操作として機能する」ことを表し、後半 2 式は得られる射影が直交射影であることを保証する。
5. 射影としての AA^+ と A^+A
A のコンパクト SVD を
A=U_r\Sigma_rV_r^*
とすると、
AA^+=U_rU_r^*
であり、これは \operatorname{Col}(A) への直交射影である。また
A^+A=V_rV_r^*
であり、これは行空間への直交射影である。実行列では * を T に置換する。
具体例
A=\begin{pmatrix}
2&0\\
0&0
\end{pmatrix}
とする。この行列は第二成分を消去するため、正則ではない。特異値は 2,0 である。したがって
A^+=\begin{pmatrix}
1/2&0\\
0&0
\end{pmatrix}
である。失われた第二成分は復元されない。
この例では
AA^+=\begin{pmatrix}
1&0\\
0&0
\end{pmatrix},\qquad
A^+A=\begin{pmatrix}
1&0\\
0&0
\end{pmatrix}
である。どちらも第一成分の軸への直交射影であり、消去された第二成分を復元しない。
射影としての見方と数値計算上の注意
擬似逆行列は、射影とも密接に関係する。AA^+ は列空間への直交射影、A^+A は行空間への直交射影として解釈できる。
数値計算では、極端に小さい特異値をそのまま逆数にすると誤差が増幅される。そのため、小さい特異値を除外する切断 SVD
A_k^+=\sum_{i=1}^k \sigma_i^{-1}v_i u_i^*
や、\sigma_i^{-1} の代わりに \sigma_i/(\sigma_i^2+\lambda) を用いる正則化が利用される。
判定基準
- 擬似逆行列は特異値分解から定義される。
- 非零特異値だけを逆数にする。
- 正則行列では通常の逆行列と一致する。
- ペンローズの 4 条件により一意に定まる。
- 解が存在しない場合は最小二乗解を与える。
- 解が複数存在する場合は最小ノルム解を選択する。
どこまで成り立つか
擬似逆行列は任意の実行列・複素行列に定義できる。ただし特異値が極端に小さい場合、逆数が大きくなり、数値的不安定性が生じる。この場合は切断特異値分解や正則化を検討する。
最終形
\boxed{A=U\Sigma V^T,\qquad A^+=V\Sigma^+U^T}
\boxed{A=U\Sigma V^*,\qquad A^+=V\Sigma^+U^*\quad(\text{complex case})}
\boxed{x=A^+b}
\boxed{A^+=(A^TA)^{-1}A^T\quad\text{if columns are independent}}
\boxed{AA^+=\operatorname{proj}_{\operatorname{Col}(A)},\qquad A^+A=\operatorname{proj}_{\operatorname{Row}(A)}}
一言でいうと
- 擬似逆行列は、逆行列を持たない行列に対して、射影と最小化に基づく代表的な逆操作を与える。