二次形式と正定値行列
mathlinear-algebraundergraduatelecture
導入
この講義で重要なのは、二次形式は行列によって定まる二次式であり、対称行列の固有値を通じて符号を判定できるということである。
固有値は、対角化の計算だけのために存在する概念ではない。二次形式を観察すると、固有値は曲面の伸びや凸性を支配する量として確認できる。
用語と定義
二次形式 とは、実正方行列 A によって
q(x)=x^T A x
と定義される関数である。ここで x\in\mathbb R^n である。
エルミート形式 とは、複素の場合に
q(x)=x^*Ax
と書く量である。ここでは A をエルミート行列とする。この条件により、x^*Ax は実数として符号を判定できる。
正定値行列 とは、実対称行列 A が任意の x\ne0 について
x^T A x>0
を満たすことである。非負定値は x^TAx\ge0、負定値は x^TAx<0、不定は正にも負にもなる場合である。
直感的な説明
二次形式は、方向ごとに値の増加の仕方を測定する装置である。正定値であれば、原点からどの方向へ移動しても値が正になる。これは原点が谷の底のように振舞うことに対応する。
不定であれば、方向によって値が正にも負にもなる。鞍点のような形状が発生する。
厳密な説明
1. 反対称成分は二次形式に寄与しない
任意の実正方行列 A について
A=\frac{A+A^T}{2}+\frac{A-A^T}{2}
と分解できる。S=(A+A^T)/2 は対称行列、K=(A-A^T)/2 は反対称行列である。反対称行列については
x^TKx=0
であるため、
x^TAx=x^TSx
である。したがって二次形式では対称部分だけを考察すれば十分である。
2. 正定値性と固有値
A を実対称行列とする。このとき次は同値である。
\boxed{A\text{ は正定値}\iff \lambda_i>0\ (i=1,\dots,n)}
理由は直交対角化である。A=QDQ^T、y=Q^Tx とすると
x^TAx=\lambda_1y_1^2+\cdots+\lambda_ny_n^2
である。すべての \lambda_i が正なら、x\ne0 すなわち y\ne0 に対して x^TAx>0 である。逆に、ある \lambda_i<0 なら、その固有方向で値は負になる。
境界として、ある \lambda_i=0 の場合も確認しておく。このとき、その固有値に対応する単位固有ベクトルを q_i とすれば、q_i\ne0 であるにもかかわらず
q_i^TAq_i=0
となる。したがって A は正定値ではない。つまり「\lambda_i\ge 0」では正定値には不足であり、すべての固有値が正であること、すなわち \lambda_i>0 が必要である。
3. シルベスター判定法
実対称行列 A について、左上からの主小行列式がすべて正であることは、A が正定値であることと同値である。
\det A_1>0,\quad \det A_2>0,\quad \dots,\quad \det A_n>0
この判定法は計算上有用である。ただし、本質は固有値の符号による判定である。
4. シルベスターの慣性法則
実対称行列 A に対して、可逆な変数変換 x=Py を行うと
x^TAx=y^T(P^TAP)y
となる。このような変換を合同変換という。対角化によって二次形式を
y_1^2+\cdots+y_p^2-y_{p+1}^2-\cdots-y_{p+q}^2
のような形へ整理しても、正の平方項の個数 p、負の平方項の個数 q、0 の個数は変化しない。これをシルベスターの慣性法則という。この不変量により、二次形式の符号構造は座標選択に依存しない。
具体例
A=\begin{pmatrix}
2&1\\
1&2
\end{pmatrix}
とする。二次形式は
x^TAx=2x_1^2+2x_1x_2+2x_2^2
である。この行列の固有値は 3,1 であり、どちらも正である。したがって A は正定値である。
直交対角化した座標では
x^TAx=3y_1^2+y_2^2
となる。交差項 2x_1x_2 は、主軸に沿った座標へ変換すると消去される。
ヘッセ行列による極値判定
二次形式は、多変数関数の二階微分とも関係する。点 a が停留点、すなわち \nabla f(a)=0 を満たすとき、ヘッセ行列 H_f(a) が正定値なら a は狭義局所最小点である。負定値なら狭義局所最大点であり、不定なら鞍点になる。停留点であることを仮定しない場合、ヘッセ行列の正定値性だけでは局所極値を結論できない。
判定基準
- 二次形式では、対称部分だけが寄与する。
- 実対称行列の正定値性は、すべての固有値が正であることと同値である。
- 非負定値は、すべての固有値が 0 以上であることと同値である。
- 不定は、正の固有値と負の固有値が混在する状態である。
- 停留点では、ヘッセ行列の正定値性が狭義局所最小の十分条件になる。
どこまで成り立つか
固有値で正定値性を判定する議論は、対称行列またはエルミート行列を基本対象にする。一般の非対称行列では、二次形式に寄与するのは対称部分である。
複素では x^TAx ではなく x^*Ax を使う。エルミート行列でない A に対しては、x^*Ax が一般に複素数になり、正・負という判定がそのままでは意味を持たない。
最終形
\boxed{q(x)=x^TAx}
\boxed{x^TAx=y^TDy=\sum_i\lambda_i y_i^2}
\boxed{A>0\iff \lambda_i>0\ \text{for all }i}
\boxed{A>0\iff \det A_k>0\ (k=1,\dots,n)}
\boxed{\text{合同変換では慣性指数が保存される}}
一言でいうと
- 二次形式は、対称行列の固有値によって符号と形状を判定できる二次式である。