確率と測度

測度としての確率と確率空間

集合とその記号

実数全体 \(\mathbb{R}\) は非可算集合である.もし \([0, 1]\) の実数が可算集合であるとする.それぞれは2進数で表すと \(0.10110 \cdots\) のように表せる(有限桁で終わるなら0で埋める).この2進数で表した実数を1番目から並べて,各n番目の実数のn桁目を反転することで(2進数で無限桁の)新しい実数を作ることができるが,この実数は表の中に存在できない.もしこの実数が表の中にあるとしたら,どの他の実数と比べてもある桁が異なっているためである.よって \(\mathbb{R}\) は非可算である.

σ-algebraと測度

ある空でない集合 \(S\) に対してその部分集合の集合族 \(\mathcal{M}\) が以下の性質を満たすとき, \(\mathcal{M}\) はσ-algebraであるという.

  1. \(\emptyset \in \mathcal{M}\)
  2. \(A \in \mathcal{M}\) ならば \(A^{c} \in \mathcal{M}\)
  3. \(n = 1, 2, \cdots\) に対し \(A_n \in \mathcal{M}\) ならば \(\cup_{n=1}^{\infty} A_n \in \mathcal{M}\) である

Sの部分集合でσ-加法族 \(\mathcal{M}\) に属するものを \(\mathcal{M}\) -可測集合であるという.3つ目の条件は可算無限個の集合を対象にしているが,実際は他の通常必要な演算を包含している.例えばある部分以降を \(\emptyset\) にすれば有限個の集合の和

\begin{align*} A_1 \cup A_2 \cdots \cup A_n \end{align*}

になるし,これにより有限個の積集合などの操作により得られる

\begin{align*} & \bigcap_{n=1}^{\infty} A_{n}=\left(\bigcup_{n=1}^{\infty} A_{n}^{c}\right)^{c} \\ & A \cap B=\left(A^{c} \cup B^{c}\right)^{c} \\ & A \backslash B=A \cap B^{c} \end{align*}

\(\mathcal{M}\) に含まれる(定義としては簡潔に3つ目の条件だけで十分).

定義1.8 部分σ-加法族

同じ集合の上で定義された2つのσ-加法族について,一方が他方を部分集合として含むとき,後者を前者の部分σ-加法族という.

例えばサイコロの目の標本 \(\Omega = \{1,2, \cdots, 6\}\) の冪集合を \(\mathcal{F}\) とすると, \(B=\{2,4,6\}\) として \(\mathcal{G}=\{ \emptyset, B, B^{c}, \Omega \}\) なるσ-加法族は, \(\mathcal{F}\) の部分σ-加法族である.これは \(\mathcal{F}\) よりも「粗い」ということである.

定義1.9 測度,測度空間

可測空間 \((S, \mathcal{M})\) に対し,集合関数 \(\mu: \mathcal{M} \rightarrow \mathbb{R}\) が以下の性質を満たすとき, \(\mu\) を測度という.

  1. 任意の \(A \in \mathcal{M}\) に対し, \(0 \leq \mu (A) \leq \infty\) ,かつ \(\mu (\emptyset) = 0\)

  2. 互いに排他的な \(A_1, A_2, \cdots \in \mathcal{M}\) について

    \(\mu \left( \bigcup_{n=1}^{\infty}A_n \right) = \sum_{n=1}^{\infty}\mu (A_n)\)

またこの組 \((S, \mathcal{M}, \mu)\) を測度空間という.

定義1.10 有限測度
測度空間 \((S, \mathcal{M}, \mu)\) において \(\mu(S) < \infty\) を満たすとき, \(\mu\) は有限測度であるという.
定義1.11 零集合
測度空間 \((S, \mathcal{M}, \mu)\) において \(\mu(N)\) であるような \(N \in \mathcal{M}\) を零集合という.またある命題が \(S \backslash N\) において成立しているとき,この命題は「ほとんどいたるところ」で成立するという.

確率空間

確率とは積分値が1になるような有限測度である.

定義1.12 確率空間
測度空間 \((\Omega, \mathcal{F}, P)\)\(P(\Omega) = 1\) であるものを確率空間という.

「標本」と「事象」の違いは重要である.「事象」とは \(\mathcal{F}\) に含まれる \(\Omega\) の部分集合であるが, \(\mathcal{F}\) に含まれない部分集合は「事象」ではないため起こり得ず,確率はundefである.

確率測度の構成

拡張定理

有限回の試行や標本の場合は話が単純で済むので測度論はほとんど必要ない.試行回数の極限をとったり,標本空間が非可算である場合に測度論が必要になる.その場合,有限回で用いている測度を無限回に「拡張」することが考えられる.Hopfの拡張定理は有限の状況からスタートする.

以下の有限加法族は「測度」が有限ということではなく有限回の和について閉じているという意味なので注意.

定義1.13 有限加法族

S上の部分集合族 \(\mathcal{A}\) が以下を満たすとき有限加法族という.

  1. \(\emptyset \in \mathcal{A}\)
  2. \(A \in \mathcal{A}\) ならば \(A^{c} \in \mathcal{A}\)
  3. \(A, B \in \mathcal{A}\) ならば \(A \cup B \in \mathcal{A}\)
有限加法的集合関数

S上の有限加法族 \(\mathcal{A}\) 上で定義された \(\nu\) が以下の性質を満たすとき,有限加法的な集合関数であるという.

  1. \(\forall A \in \mathcal{A} \quad 0 \leq \nu (A) \leq \infty\) であり,特に \(\nu (\emptyset) = 0\)

  2. \(A, B \in \mathcal{A}\) かつ \(A \cup B = \emptyset\) ならば

    \(\nu (A \cap B) = \nu (A) + \nu (B)\)

定理1.15 生成されたσ-加法族
Sの部分集合からなる集合族 \(\mathcal{M}_0\) (何でも良い,{{1, 3}, {5, 6}}とか)に対し,この \(\mathcal{M}_0\) を含むような最小のσ-加法族が存在し,これを \(\sigma [\mathcal{M}_0]\) とかく.
Hopfの拡張定理
S上の有限加法族 \(\mathcal{A}\) 上で定義された集合関数 \(\nu\)\(\mathcal{A}\) 上でσ-加法的である(可算無限個の互いに素な集合の和についても成り立つ)ならば, \(\mathcal{A}\) から生成されたσ-加法族 \(\sigma [\mathcal{A}]\) 上の測度 \(\mu\) に拡張できる.

拡張定理の例

無限回のコイン投げの例.要素を"H"と"T"の無限長の文字列として標本空間を構成する.

\begin{align*} \Omega = \{ \omega_1 \omega_2 \cdots \omega_n \cdots \mid \omega_n \in \{H, T\} \} \end{align*}

ここで「2回連続して表が出る確率」などを求められるようにσ-加法族と確率測度を構成したい.

\(\Omega\) の部分集合として,ある自然数 \(k\)\(n_1 < \cdots < n_k\)\(\varepsilon_1, \cdots, \varepsilon_n \in \{H, T\}\) について

\begin{align*} A(n_{1}, \ldots, n_{k} ; \varepsilon_{1}, \ldots, \varepsilon_{k})=\{(\omega_{n})_{n \in \mathbb{N}} \in \Omega: \omega_{n_{1}}=\varepsilon_{1}, \ldots, \omega_{n_{k}}=\varepsilon_{k}\} \end{align*}

なる部分集合を考える.これは無限列において有限個の場所とそこでの値を指定して「ひとまとめにくくった」集合族である.この形の集合は有限加法族をなす.例えば

\begin{align*} & A(1,3,5 \mid H,T,H) \\ & B(1,2,3 \mid T,T,T) \end{align*}

とすると,

  • 1回目はTでもHでも良い
  • 2回目はT
  • 3回目はT
  • 5回目はH

であるから, \(C(2,3,5 \mid T,T,H)\) なる別の「特定の回数目での値を指定された集合」になる.これらのなす有限加法族 \(\mathcal{A}\) 上の集合関数 \(P\) を「表の出る確率」 \(p\) について

\begin{align*} P (A(n_{1}, \ldots, n_{k} ; \varepsilon_{1}, \ldots, \varepsilon_{k}) )=p^{m}(1-p)^{k-m} \end{align*}

で定める.ここで \(m\) は表の回数である.このPが \(\mathcal{A}\) 上でσ-加法的であることを示せれば,集合関数Pが \(\sigma [\mathcal{A}]\) 上での測度であることが示せる.

ルベーグ測度

定義1.16 ボレル集合族
\(\mathcal{R}\) のすべての開区間のなす集合族 \(\mathcal{O}\) から生成される集合族を \(\mathcal{B}(\mathbb{R})\) という.

可算無限個の加法により

\begin{align*} [a, b]=\bigcap_{n=1}^{\infty} (a-\frac{1}{n}, b+\frac{1}{n}) \end{align*}

となるから,このボレル集合族には閉区間[a, b]や(a, b]や[a, b)も含まれる.

定理1.5 ボレル集合族上のルベーグ測度
\((\mathbb{R}, \mathcal{B}(\mathbb{R}))\) 上の測度 \(l\) で,任意の \(a, b \in \mathbb{R}\) について \(l((a, b]) = b -a\) なるものが一意に存在する.
定義1.17 測度空間の完備性

測度空間 \((S, \mathcal{M}, \mu)\) の零集合の部分集合が常に可測であるとき,この測度空間は完備であるという.

完備でない測度だと,例えば零集合の部分集合がルベーグ非可測になっているせいで「バナッハ・タルスキーのパラドックス」のような不自然が起こりうる().

定理1.6 測度空間の完備化
(完備でない)測度空間 \((S, \mathcal{M}, \mu)\) に対し, \(\mu\) -零集合 \(N\) の任意の部分集合を全て追加したσ-加法族 \(\bar{\mathcal{M}}\)\(\bar{\mu}(B \cup Z)=\mu(B)\) を定義すると,測度空間 \((S, \bar{\mathcal{M}}, \bar{\mu})\) は完備である.

ルベーグ可測でない集合の例(Vitali set)

有限集合についてはその冪集合に対して組み合わせ的に確率を割り当てられるので測度論を使う必要はない.一方有限でない集合についてはその冪集合の上で常に測度を導入することはできないという事実がある.以下で具体例を構成する.

区間[0, 1]においてある実数 \(\alpha\) との差が有理数である実数を全て集めて集合 \(B_{\alpha}\) を作る.このような \(\alpha\) を代表元の集合 \(\Lambda\) で集めると集合族 \(\{ B_{\alpha} \mid \alpha \in \Lambda \}\) によって[0, 1]を直和に分解することができる(らしい).

\begin{align*} [0,1]=\bigcup_{\alpha \in \Lambda} B_{\alpha} \end{align*}

この \(B_{\alpha}\) において各 \(\alpha\) について要素を1つずつ選んで集合 \(E\) を作ると,これはルベーグ可測ではない.以下証明.

[-1, 1]に含まれる有理数は可算であるので,それを数列 \(\{ q_n \}\) でリストする. \(E\) を各 \(q_n\) で平行移動して \(E_n\) を作る.

\begin{align*} E_n = \{ e + q_n \mid e \in E \} \end{align*}

もし \(E\) がルベーグ可測ならば \(E_n\) もルベーグ可測である.

そして各 \(E_n\) はmutually exclusiveである.もし \(z \in E_n \cap E_m\) が存在したならば

\begin{align*} z = x + q_n = x^{\prime} + q_m \end{align*}

なる \(x, x^{\prime} \in E\) が存在するはずであるが

\begin{align*} x - x^{\prime} = q_m - q_n \in \mathbb{Q} \end{align*}

より \(x = x^{\prime}\) であり,よって \(q_n = q_m\) が結論されるためである.さらに

\begin{align*} [0,1] \subset \bigcup_{n=1}^{\infty} E_{n} \subset[-1,2] \end{align*}

である.まず任意の \(r \in [0, 1]\) はいずれかの \(B_{\alpha}\) に属している.よってそこから \(E\) に選ばれた要素を \(e\) とすると, \(\{e + q \mid q \in [-1, 1] \}\) のいずれかが \(r\) と等しい.よって

\begin{align*} [0,1] \subset \bigcup_{n=1}^{\infty} E_{n} \end{align*}

また \(E \subset [0, 1]\) に[-1, 1]の有理数を足すと当然

\begin{align*} \bigcup_{n=1}^{\infty} E_{n} \subset[-1,2] \end{align*}

である.

もし \(E\) がルベーグ可測であるならば \(E_n\) もルベーグ可測であり,その値は \(E\) と同じである.よって測度の完全加法性と,集合の包含関係の条件から

\begin{align*} 1 = l([0,1]) \leq l(\bigcup_{n=1}^{\infty} E_{n}) = \sum_{n=1}^{\infty} l(E_{n}) = \sum_{n=1}^{\infty} l(E) \leq l([-1,2]) = 3 \end{align*}

が成立することになるが, \(\sum_{n=1}^{\infty}l(E)\)\(0\)\(\infty\) であることが必要であるが,いずれも不等式の左辺と右辺に矛盾する.

このルベーグ非可測な集合の構成には集合族から要素を1つずつ選んで新たな集合を作るという「選択公理」を用いている.この選択公理がないと現代数学でできることは限られるが,同時に 「バナッハ・タルスキーのパラドックス」 のような非自明な結果(このパラドックスではルベーグ非可測な断片を球から作り出していることが原因で)も引き出せてしまう.