ラドンニコディムの定理と条件付き期待値

条件付き期待値とその意味

定義5.2 古典的な条件付き期待値
確率空間 \((\Omega, \mathcal{F}, P)\) と事象 \(B \in \mathcal{F}\) に対し,条件付き確率 \(P(\cdot \mid B)\) による確率変数 \(X\) の期待値を \(E[X \mid B]\) とかく.

条件付き期待値では \(\omega \notin B\) に対しては \(P(\omega) = 0\) としているので,依然として \(B\) に含まれない事象を含めた標本空間全体で積分をしても積分値は1である.

例えばサイコロを1回投げる試行において,

\begin{align*} & \Omega = \{1,2,3,4,5,6\} = \bigcup A_i \\ & X(A_i) = i \\ & P(A_i) = 1/6 \end{align*}

とする. ここで偶数が出るという事象Bによって条件付けると確率測度は

\begin{align*} P(A_{i} \mid B) = \begin{cases} 0 & i \in\{1,3,5\} \\ 1 / 3, & i \in\{2,4,6\} \end{cases} \end{align*}

となる.これは依然として \(B^{c}\) の確率が0となっただけで,全体の積分値は1である.期待値は今までと同様確率変数と確率をかけて足すことで

\begin{align*} E[X \mid B]=1 \cdot 0+2 \cdot \frac{1}{3}+\cdots+5 \cdot 0+6 \cdot \frac{1}{3}=\frac{12}{3}=4 \end{align*}

と求める.

σ-加法族による条件付き期待値

条件を満たさない方の標本空間の分割についても期待値を計算する感じ.

「偶数の目が出るとしたら」という条件ではなく「偶数か奇数か知ることができるなら」というふうに,与えられた「 情報 」によって標本空間に分割線を引くことで ユーザー側(主観者) は条件付き期待値の 定義域を細かく 刻んでいく.

先程の例では \(E[X \mid B] = 4\) だったが,同様に \(E[X \mid B^{c}] = 3\) である.これは確率変数 \(\mathcal{X}\) は初めは可測集合が \(\Omega\) だけであり,その上で平均値7/2をとるが,偶奇が分かるという情報の下では可測集合が \(B, B^{c}\) に分割され,各定義域で以下のように値が期待される

\begin{align*} E[X \mid \mathcal{G}](\omega) = \begin{cases} 3 & (\omega \in B^{c}) \\ 4 & (\omega \in B) \end{cases} \end{align*}

と考える.さらに細かい情報 \(\mathcal{F}\) による条件付き確率は

\begin{align*} E[X \mid \mathcal{F}](\omega) = \begin{cases} 1 & (\omega \in A_1) \\ \cdots \\ 6 & (\omega \in A_6 ) \end{cases} \end{align*}

であり,これは確率変数 \(X\) そのものである.

現代確率論では期待値は「粗い定義域でもとの確率変数を平均化」した関数として公理的に定義する(条件付き確率のことは知らない前提).

定義5.3 条件付き期待値
確率空間 \((\Omega, \mathcal{F}, P)\) 上の可積分な確率変数 \(X\) と,その部分σ-加法族 \(\mathcal{G}\) に対し,任意の \(G \in \mathcal{G}\) について \(\int_{G} Y(\omega) P(d \omega)=\int_{G} X(\omega) P(d \omega)\) が成立する \(\mathcal{G}\) -可測(つまりXより定義域が粗い)な確率変数Yのことを条件付き期待値と呼び \(Y = E[X \mid \mathcal{G}]\) と書く.
定義5.4 条件付き確率
確率空間 \((\Omega, \mathcal{F}, P)\) と部分σ-加法族 \(\mathcal{G} \in \mathcal{F}\) に対し,事象 \(A \in \mathcal{F}\)\(\mathcal{G}\) に関する条件付き確率は \(P(A \mid \mathcal{G})(\omega)=E[1_{A} \mid \mathcal{G}](\omega)\) で定義される確率変数 \(P(A \mid \mathcal{G})(\omega)\) である

例として以下のグリッドで表される \((\mathcal{\Omega}, \mathcal{F})\) における事象 \(A\) と,より粗いグリッド \((\Omega, \mathcal{G})\) が与えられたときの条件付き確率を求める.

条件付き確率 \(P(A \mid \mathcal{G})(\omega)\)\(\omega \in G_1, G_2, G_3, G_4\) の4つの場合で場合分けする.

まず \(G_1\) では定義より

\begin{align*} \int_{G_1} P(A \mid \mathcal{G})(\omega) P(d\omega) = \int_{G_1} 1_{A} P(d\omega) \end{align*}

が成立する.ここで右辺は \(\mathcal{F}\) -可測な関数 \(1_{A}\) を積分するので, 図の左側のグリッド 上で積分する. \(\mathcal{F}\) は48個のマス目からなるから1つのメス目の確率は1/48であり, \(A \cup G_1\) は2つのマス目からなるから,右辺の積分値は2/48である.

左辺の \(P(A \mid \mathcal{G})\)\(G_1\) 上での値は \(G_1\) 全体で一定値 であるから,右辺の積分値は

\begin{align*} 9/48 \times P(A \mid G_1) \end{align*}

よって

\begin{align*} P(A \mid G_1) = 2/9 \end{align*}

である.同様にすることで

\begin{align*} P(A \mid \mathcal{G}) = \begin{cases} 2/9 & \omega \in G_1 \\ 2/15 & \omega \in G_2 \\ 4/15 & \omega \in G_3 \\ 4/9 & \omega \in G_4 \end{cases} \end{align*}

それぞれ \(G_i\) である場合の \(A\) の条件付き確率である.

これを積分すると \(P(A) = 12/48\) となることも確認できる.

このように積分値が一致する, もとの関数より可測性を粗くした 関数が存在することを前提としているが,この関数の存在と一意性を主張するのがラドンニコディムの定理である.

ラドン・ニコディムの定理

測度の絶対連続性

定理5.2
測度空間 \((S, \mathcal{M}, \mu)\) 上の非負実数値の可測関数 \(f\) を使って \(\forall A \in \mathcal{M}\) に対し \(\nu(A) = \int_A f(x) \mu (dx)\) と定義すると \(\nu\) もまた測度である.

逆に2つの測度があるときにこのような関数 \(f\) が存在するかどうかを調べたい.

定義5.5 絶対連続性
可測空間 \((S, \mathcal{M})\) 上の2つの測度 \(\mu, \nu\) に対し \(\forall A \in \mathcal{M}\) について \(\mu (A) = 0\) ならば \(\nu (A) = 0\) が常に成り立つとき \(\nu\)\(\mu\) に関して絶対連続であるといい, \(\nu \ll \mu\) と書く.
定理5.3
可測空間 \((S, \mathcal{M})\) 上の2つの測度 \(\mu, \nu\) がともにσ-有限で \(\nu \ll \mu\) であるならば任意の \(B \in \mathcal{M}\) に対して \(\nu (B) = \int_B f(x) \mu (dx)\) なる非負実数値関数 \(f\) が存在しほとんど至るところの意味で一意である.これを \(d\nu / d\mu\) とかく.
定理5.6 条件付き期待値の性質

1. 条件で粗く期待値をとってから期待値をとるのは初めから期待値をとるのと同じ \(E[E[X \mid \mathcal{G}]]=E[X]\)

2. 細かく条件付き期待値をとってから粗く期待値をとるのは,初めから粗く期待値をとるのと同じ \(E[E[X \mid \mathcal{H}] \mid \mathcal{G}]=E[X \mid \mathcal{G}]\)

  1. \(X\)\(\mathcal{G}\) -可測である,すなわち \(X\) の定義域が \(\mathcal{G}\) より粗いか同じならば期待値をとっても変わらない(「より大雑把な情報を与えても」定義域は変わらないので確率変数も変化しない). \(E[X \mid \mathcal{G}] = X\)

(3)の具体例としては確率変数Xとσ-加法族を

\begin{align*} & \mathcal{F} = \{ \emptyset, \Omega \} \\ & X(\omega_i) = i, \quad \omega_i = \{1, \cdots, 6\} \\ \end{align*}

と定義する.ここで偶数が出る事象 \(B=\{2,4,6\}\) によりσ-加法族 \(\mathcal{G} = \{ \emptyset, B, B^{c}, \Omega \}\) を与えたときの条件付き期待値を考えるとしよう.Xは \(\mathcal{G}\) -可測である.よって \(\{2,4,6\}\) のいずれかが出たとき依然として「 \(\{1, \cdots, 6\}\) のいずれかが出た」という情報しか得られていないので期待値は3.5であるし, \(\{1,3,5\}\) が出たときも依然として「 \(\{1, \cdots, 6\}\) のいずれかが出た」という情報しか得られていないので期待値は3.5である.

この性質はマルチンゲールの定義にも使われている.

定義 マルチンゲール
確率変数 \(X_n\)\(\mathcal{F}_n\) 可測であり, \(m \leq n\) ならば \(E[ X_n \mid \mathcal{F}_m] = X_n\) が成立するとき \(X_n\)\(\mathcal{F}_n\) -マルチンゲールであるという.