行列式について

行列式の用途

行列式は定義を読んでも用途が解りにくいため、先に使用事例を挙げる。

ヤコビ行列式

一変数関数の積分の変数変換を知っているだろう:

(1)\[\int f(x) dx=\int f(g(t)) g'(t) dt\]

多変数になると、この公式は次のようになる:

(2)\[\int f(x) dx = \int f(g(t)) \det{g'}(t) dt\]

ただし、 \(f\) は多変数関数で、 \(x, t\) は複数の変数を一つの文字で表している。ここで \(g'\)\(g\) のヤコビ行列と呼ばれる行列で、 \(\det{g'}\) がその行列式だ。

逆行列の存在と線形方程式系

\(n\) 次正方行列 \(A\) に逆行列が存在するための必要十分条件は \(A\) の行列式が0にならないことだ。そのため、線形方程式系 \(Ax=b\) が逆行列を使って \(x=A^{-1}b\) と解けるかどうかが \(A\) の行列式によって決まる。

逆行列の公式

可逆な行列の逆行列を明示的に与えるクラメルの公式は、行列式を使って記述される。

行列式の定義

符号付き体積

行列式は、符号付き体積を一般化した概念だ。符号付き体積は一般の \(\mathbb{R}^n\) に関して定義されるが、ここでは \(n=2\) の場合、つまり、符号付き面積を例示する。

\(a, b\)\(\mathbb{R}^2\) のベクトルとすると、これらは平行四辺形を一つ定める。 \(a=\vec{OP}\)\(b=\vec{OQ}\)\(a+b=\vec{OR}\) と表した時の四角形 \(OPRQ\) だ。

\(a_1, a_2\) の位置関係によって、四角形 \(OPRQ\) の面積に、次のように正か負の符号を定める:

  1. \(a_1, a_2\) が平行の時(どちらかが零ベクトルである場合も含む)、符号付き面積は0
  2. 上記以外の時、 \(a_1\) を回転させて \(a_2\) に重ね合わせるには、反時計周りに回した方が近いか時計回りに回した方が近いかのどちらかだが、前者なら符号は正とし、後者なら符号は負とする。

こうして \(a_1, a_2\) から定まる符号付き面積を、 \(D(a_1, a_2)\) と書く。

計算例

\(e_1=(1, 0), e_2=(0,1)\) に関して、

  1. \(D(e_1, e_2)=1\)
  2. \(D(e_2, e_1)=-1\)

符号付き体積の性質

符号付き面積 \(D(a_1, a_2)\) は、ベクトルを2つ与えると実数値を一つ返す写像だ:

(3)\[D:\mathbb{R}^2\times \mathbb{R}^2\rightarrow \mathbb{R}\]

この写像は、次の性質を持つ:

  1. 各成分に関して線形。つまり、任意のベクトル \(a_1,a_2,b\in \mathbb{R}^2\) 、スカラー \(c\in \mathbb{R}\) に関して、次が成り立つ:
(4)\[\begin{split}\begin{align} D(a_1+b, a_2)&= D(a_1, a_2)+D(b, a_2)\\ D(a_1, a_2+b)&= D(a_1, a_2)+D(a_1, b)\\ D(ca_1, a_2)&=cD(a_1, a_2)\\ D(a_1, ca_2)&= cD(a_1, a_2) \end{align}\end{split}\]
  1. 任意のベクトル \(a\in \mathbb{R}^2\) に関して、 \(D(a, a)=0\)
  2. \(D(e_1, e_2)=1\)

定義. 写像D

上記の性質を参考に、符号付き体積の概念を一般化する。

\(K\) を任意の体とし、 \(V=K^n\) とする。次の性質を満たす写像 \(D:V^n\rightarrow K\) がただ一つ存在する:

  1. \(D\) は各成分に関して線形。つまり、任意の添字 \(i\) 、ベクトル \(a\) 、スカラー \(c\) に関して、
(5)\[\begin{split}\begin{align} D(x_1, \dots, x_i+a,\dots, x_n)=&D(x_1,\dots,x_i,\dots, x_n)\\ &+D(x_1, \dots, a, \dots, x_n),\\ D(x_1, \dots, cx_i, \dots, x_n)=&cD(x_1, \dots,x_i, \dots, x_n) \end{align}\end{split}\]
  1. 相等しいベクトルがあれば、 \(D\) の値は0:
(6)\[D(x_1, \dots, a, \dots, a,\dots,x_n)=0\]
  1. \(D(e_1, \dots, e_n)=1\)

1の性質を \(n\) 重線形性 、3の性質を 正規性 という。

この \(D\) の存在と唯一性は、次節の Dの計算 で示す。

\(D\) はベクトルの位置を交換すると符号が変わる:

(7)\[D(x_1, \dots, a, \dots, b,\dots,x_n)=-D(x_1,\dots, b,\dots, a,\dots, x_n)\]

命題. 線形従属なベクトルのDは零

\(a_1, \dots, a_n\) が線形従属の時、 \(D(a_1, \dots, a_n)=0\)

定義. 行列式

任意の行列 \(A\in \text{Mat}(n, n;K)\) に関して、 \(A\) の第 \(i\) 列を \(a_i\) とした時、 \(D(a_1, \dots, a_n)\)\(A\)行列式 といい、 \(\det{A}\)\(| A|\) と書く。

Dの存在と唯一性

本論に入る前に、置換と符号の概念を導入する必要がある。

定義. 対称群、置換

集合 \(I_n = \{1, 2, \dots, n\}\) に関して、 \(I_n\) から \(I_n\) への全単射全体の集合を \(S_n\) と書く。これは \(\sigma, \tau\in S_n\) に関して積を \(\sigma\circ\tau = \sigma\tau\) と定義することで群になり、 \(n\) 次の 対称群 という。 \(S_n\) の元を \(n\) 文字の 置換 という。

\(\sigma \in S_n\) を次のように表示する:

(8)\[\begin{split}\begin{pmatrix} 1 & 2 & \dots & n\\ \sigma(1) & \sigma(2) &\dots & \sigma(n) \end{pmatrix}\end{split}\]

定義. 互換

置換 \(\sigma :I_n \rightarrow I_n\) は、ある \(i, j (1\leq i < j \leq n)\) が存在して次を満たす時、 互換 という:

  1. \(\sigma(i)=j, \sigma(j)=i\)
  2. \(i, j\) 以外の任意の \(s\in I_n\) に関して、 \(\sigma(s)=s\)

つまり、二つの文字 \(i, j\) の位置を入れ替える変換だ。上記の互換を \((i \ j)\) と書く。

互換の積による置換の表示

任意の置換はいくつかの互換の積で書ける。ただし、この書き方は一通りとは限らない:

(9)\[\begin{split}\begin{align} \begin{pmatrix} 1 & 2 & 3\\ 2 & 3 & 1 \end{pmatrix} =& (1\ 2)(2\ 3)\\ =& (1\ 3)(2\ 3)(1\ 2)(1\ 3) \end{align}\end{split}\]

命題. 互換の積による表示の偶奇

\(\sigma\)\(S_n\) の任意の元とする。 \(\sigma\)\(p\) 個の互換の積で表す方法と \(q\) 個の互換の積で表す方法がある時、 \((-1)^p=(-1)^q\)

証明の手引:

\(n\) 変数の 差積 と呼ばれる次の多項式を考える:

(10)\[\begin{split}\begin{align} \Delta(x_1, \dots, x_n)=&\prod_{1\leq i<j\leq n}(x_i-x_j)\\ =&(x_1-x_2)(x_1-x_3)\dots (x_1-x_n)\\ & \times \ (x_2-x_3)(x_2-x_4)\dots (x_2-x_n)\\ & \vdots\\ & \times (x_{n-1}-x_n) \end{align}\end{split}\]

\(\sigma\in S_n\) に関して、次のように定義する:

(11)\[\Delta^\sigma(x_1, x_2, \dots, x_n) = \Delta(x_{\sigma(1)}, x_{\sigma(2)}, \dots, x_{\sigma(n)})\]

互換 \(\tau \in S_n\) に関しては \(\Delta^\tau = -\Delta\) となるから、 \(\Delta^\sigma=(-1)^p\Delta=(-1)^q\Delta\) 。故に、 \((-1)^p=(-1)^q\)

定義. 符号、偶置換、奇置換

\(\sigma \in S_n\)\(m\) 個の互換の積で書ける時、 \(\sigma\)符号 \(\text{sgn}(\sigma)\)\((-1)^m\) と定義する。

符号が1の置換を 偶置換 、 符号が-1の置換を 奇置換 という。

Dの計算

\(e_1, \dots, e_n\)\(V=K^n\) の標準基底とし、 \(n\) 個のベクトル \(a_1, \dots, a_n \in V\) に関して、

(12)\[a_j = a_{1j}e_1 + \dots +a_{ni}e_n\]

とおく。この時、第1成分に関して

(13)\[D(a_1, \dots, a_n) = \sum_{k=1}^n a_{k1}D(e_k, a_2, \dots, a_n)\]

と展開できる。このようにして、すべての成分に関して展開すると、次の形に帰着する:

(14)\[D(a_1, \dots, a_n) = \sum_{f} a_{f(1)1}a_{f(2)2}\dots a_{f(n)n} D(e_{f(1)}, \dots, e_{f(n)})\]

ここで和を全ての写像 \(f:I_n\rightarrow I_n\) に関して取っているが、全単射でない \(f\) に関しては \(D(e_{f(1)}, \dots, e_{f(n)})=0\) だから、総和は置換に関してのみ取ればよい:

(15)\[D(a_1, \dots, a_n) = \sum_{\sigma\in S_n} a_{\sigma(1)1}a_{\sigma(2)2}\dots a_{\sigma(n)n} D(e_{\sigma(1)}, \dots, e_{\sigma(n)})\]

\(D\) の交代性により、

(16)\[D(e_{\sigma(1)}, \dots, e_{\sigma(n)}) = \text{sgn}(\sigma)D(e_1, \dots, e_n)\]

だから、次のようにまとめられる:

(17)\[D(a_1, \dots, a_n) = \sum_{\sigma\in S_n} \text{sgn}(\sigma)a_{\sigma(1)1}a_{\sigma(2)2}\dots a_{\sigma(n)n}D(e_1,\dots,e_n)\]

条件 \(D(e_1, \dots, e_n)=1\) により、最終的に次の形になる:

(18)\[D(a_1, \dots, a_n) = \sum_{\sigma\in S_n} \text{sgn}(\sigma)a_{\sigma(1)1}a_{\sigma(2)2}\dots a_{\sigma(n)n}\]

以上の議論で \(D\) の唯一性が示された。つまり、 \(D\) が存在するならば、それは (18) で計算される写像に一致しなければならない。

また、 (18) で定義される写像は \(D\) の三つの条件を満たすから、 \(D\) の存在証明も得られる。

Dの定数倍

\(V=K^n\) とし、 \(E:V^n\rightarrow K\)\(写像D\) の3つの性質の内、正規性以外の2つを持つとする。

次が成り立つ:

(19)\[E=E(e_1, \dots, e_n)D\]

証明の手引:

これは Dの計算 の議論の副産物だ。この議論で \(D\) の正規性を使ったのは最後の変形のみで、そこまでは \(E\) に関しても同じ式変形ができる:

(20)\[E(a_1, \dots, a_n) = \sum_{\sigma\in S_n} \text{sgn}(\sigma)a_{\sigma(1)1}a_{\sigma(2)2}\dots a_{\sigma(n)n}E(e_1,\dots, e_n)\]

行列式の計算

計算例

\(n=1,2,3\) に関しては、次のようになる:

(21)\[\begin{vmatrix} A_{11} \end{vmatrix} = A_{11}\]
(22)\[\begin{split}\begin{vmatrix} A_{11} & A_{12}\\ A_{12} & A_{22} \end{vmatrix} = A_{11}A_{22}-A_{12}A_{21}\end{split}\]
(23)\[\begin{split}\begin{align} \begin{vmatrix} A_{11} & A_{12} & A_{13}\\ A_{21} & A_{22} & A_{23}\\ A_{31} & A_{32} & A_{33} \end{vmatrix} =& A_{11}A_{22}A_{33} + A_{12}A_{23}A_{31} + A_{13}A_{21}A_{32}\\ &-A_{11}A_{23}A_{32} - A_{12}A_{21}A_{33} - A_{13}A_{22}A_{31} \end{align}\end{split}\]

行列式の幾何学的な意味

\(A\)\(K\) 上の \(n\) 次正方行列とし、 \(A\) の列ベクトルを \(a_1, \dots, a_n\) とする。 \(A\) は標準基底 \(e_1, \dots, e_n\)\(a_1, \dots, a_n\) に移す写像 \(F_A:K^n\rightarrow K^n\) を定義する。 \(e_1, \dots, e_n\) が定義する \(n\) 次元の立方体は、 \(F_A\) によって \(a_1, \dots, a_n\) が定義する多面体に移されるから、 \(F_A\) は図形の体積を \(\det{A}\) 倍する。

この観点によって、次項の等式 \(\det{(AB)}=\det{A}\det{B}\) を幾何学的に解釈できる:体積を \(\det{B}\) 倍する写像と体積を \(\det{A}\) 倍する写像を合成すれば、体積を \(\det{A}\det{B}\) 倍する写像になる。

命題. 積の行列式は行列式の積

任意の \(K\) 上の \(n\) 次正方行列 \(A, B\) に関して、次が成り立つ:

(24)\[\det{(AB)}=\det{A}\det{B}\]

証明の手引:

(25)\[E(x_1, \dots, x_n)=D(Ax_1,\dots, Ax_n)\]

命題. 行列式と行列の可逆性

任意の行列 \(A\in \text{Mat}(n, n;K)\) に関して、 \(A\) が可逆であることと \(\det{A}\neq 0\) は同値。

証明の手引:

\(\det{A}\neq 0\) の時、 \(A\) の列ベクトルは線形独立だから、 \(A\) が自然に定義する線形写像は同型で、逆写像が存在し、それが \(A^{-1}\) を定義する。

命題. 行列式は転置で不変

任意の行列 \(A\in \text{Mat}(n, n;K)\) に関して、次が成り立つ:

(26)\[\det{A}=\det{A^T}\]

証明の手引:

(27)\[\begin{split}\begin{align} \det{A} &= \sum_{\sigma\in S_n} \text{sgn}(\sigma) a_{1\sigma(1)}\dots a_{n\sigma(n)}\\ &= \sum_{\sigma\in S_n} \text{sgn}(\sigma^{-1}) a_{1\sigma^{-1}(1)}\dots a_{n\sigma^{-1}(n)}\\ &= \sum_{\sigma\in S_n} \text{sgn}(\sigma) a_{\sigma(1)1}\dots a_{\sigma(n)n}\\ &= \det{A^T} \end{align}\end{split}\]

命題. 区分けと行列式

\(m\) 次正方行列 \(A\) の次の区分けを考える:

(28)\[\begin{split}A= \begin{bmatrix} P & Q\\ O & R \end{bmatrix}\end{split}\]

ここで、 \(P\)\(n\) 次正方行列、 \(R\)\((m-n)\) 次正方行列で、 \(O\) は零行列。次が成り立つ:

(29)\[\det{A}=\det{P}\det{R}\]