条件付き期待値とは?関係式の導出から具体例まで丁寧に解説

条件付き期待値とは,「ある事象が起きたという条件の下での期待値」です.この記事では,条件付き期待値の意味や公式の導出方法を,サイコロを使った具体例を交えて丁寧に解説します.また,条件付き期待値を活用することで複雑な確率問題を簡単に解くコツも紹介します.確率論を学ぶためだけではなく,競技プログラミングでも役に立ちます.

POINT
  • 条件付き期待値とは,「ある事象が起きたという条件のもとでの期待値」のことです.
  • 事象ごとに分割して期待値を計算できます:$\displaystyle E[X]=\sum_{i} E[X|A_{i}] P(A_{i})$
  • 複雑な確率問題の計算を簡単にする強力な手法です.


条件付き期待値の基本的な考え方については,次の記事を参照してください.
条件付き期待値とは?定義と計算例

確率

全ての事象からなる集合を $\Omega$ とします.

事象 $A \subset \Omega$ が起こる確率を$P(A)$と表します.特に,$\omega \in \Omega$ が起こる確率を $P(\{\omega\})$と書きます.

【具体例(サイコロ)】
サイコロの目を例に考えましょう.目 $i$ が出る事象を $\omega_{i}$ と表せば,$\Omega=\{\omega_{1},\omega_{2},\omega_{3},\omega_{4},\omega_{5},\omega_{6}\}$です.

偶数が出る事象は$A=\{\omega_{2},\omega_{4},\omega_{6}\}$となり,

\begin{aligned}
P(\Omega)=1, \quad P(A)=1/2, \quad P(\{\omega\})=1/6
\end{aligned}
です.

確率変数

$\omega \in \Omega$に対して実数$X(\omega)$を対応させる関数$X$を実確率変数といいます.

【具体例(サイコロ)】
上記サイコロの例で,$X(\omega_{i})=i$とすれば,$X$は各事象を出目に写す実確率変数です.

期待値

確率変数$X$の期待値は
\begin{aligned}
E[X]
&= \sum_{\omega\in\Omega} X(\omega)P(\{\omega\}) \\
&= \sum_{x\in X(\Omega)} x P\bigl(X^{-1}(x) \bigr)
\end{aligned}
と計算されます.2つ目の式は,一見難しいですが,
\begin{aligned}
\sum_{i} i\times(\text{$X$が$i$の値をとる確率})
\end{aligned}
を表しており,高校数学から馴染みのある期待値の式を意味しています.

$X^{-1}(x)$は$X(\omega)=x$となる全ての$\omega \in \Omega$からなる集合のことです.これを数式で表すと,

\begin{aligned}
X^{-1}(x)=\{\omega\in\Omega\mid X(\omega)=x\}
\end{aligned}
となります.

【具体例(サイコロ)】
サイコロの例で,$X(\omega_{i})=i$で定義される,上の例で見た実確率変数を考えます.この期待値は(1つ目の表式でも2つ目の表式でも同じように計算でき)

\begin{aligned}
E[X]
&= \sum_{\omega\in\Omega} X(\omega)P(\{\omega\}) \\
&= \sum_{i=1}^{6} i \cdot \frac{1}{6}
\end{aligned}
となります.

次に,

\begin{aligned}
X(\omega_{i})
=
\begin{cases}
\, 1 & (i=2,4,6)\\
\, 0 & (i=1,3,5)
\end{cases}
\end{aligned}
を考えれば,$X$の期待値は「偶数の出る期待値」になります.2つ目の式を使えば
\begin{aligned}
E[X]
&=\sum_{i} i\times(\text{$X(\omega)=i$となる確率}) \\
&=1 \cdot P(\{2,4,6\}) + 0 \cdot P(\{1,3,5\}) \\
&=1/2
\end{aligned}
となります.

条件付き期待値の公式と導出方法

ここまで,確率変数$X$の期待値
\begin{aligned}
E[X]
&= \sum_{\omega\in\Omega} X(\omega)P(\{\omega\})
\end{aligned}
を考えてきました.和を取る範囲を$\Omega$ではなく,その部分集合$A\subset \Omega$としたものを考えることも多いので,記号
\begin{aligned}
E[X,\textcolor{red}{A}]
&= \sum_{\omega\in\textcolor{red}{A}} X(\omega)P(\{\omega\})
\end{aligned}
を導入しておきます.あとで出てくる条件付き期待値の記号$E[X|A]$と混同しないように注意してください.


$A_{i}\cap A_{j}=\empty\,(i\neq j)$である集合$\{A_{i}\}_{i \in I}$によって$\displaystyle \Omega = \sum_{i \in I}A_{i}$と表せる場合を考えます.条件付き期待値の性質は,事象が起きた上での期待値を事象ごとに分割できることです.

\begin{aligned}
E[X]
&= \sum_{i \in I} (\text{事象$A_{i}$が起きた上での期待値}) \\
& \qquad \times (\text{事象$A_{i}$が起こる確率})
\end{aligned}

つまりこれは,事象ごとに場合分けした期待値をそれぞれ計算し,最後に確率を掛けて総和を取ればよい,という意味です.

ここで,

\begin{aligned}
E[X|A_{i}]
&= (\text{事象$A_{i}$が起きた上での期待値})
\end{aligned}
を$X$の条件付き期待値と呼びます.

これを示しましょう.

さて,$E[X|A_{i}]$はどのような表式になるでしょうか?
条件付き確率が$P(B | A) = P(B \cap A)/P(A)$となることを思い出して,上で定義した「期待値」の表式に当てはめると

\begin{aligned}
E[X|A_{i}]
&= \sum_{\omega \in A_{i}} X(\omega) P(\{\omega\} | A_{i})
\end{aligned}
あるいは
\begin{aligned}
E[X|A_{i}]
&= \sum_{x \in X(A_{i})} x P(X^{-1}(x) | A_{i})
\end{aligned}
が成り立ちそうです.

この予想が正しいことは,期待値を変形することで確認できます.実際,1つ目の式は

\begin{aligned}
E[X]
&=\sum_{i \in I} \sum_{\omega\in\Omega} X(\omega)P(\{\omega\} \cap A_{i}) \\
&=\sum_{i \in I} \sum_{\omega\in\textcolor{red}{A_{i}}} X(\omega)P(\{\omega\} \cap A_{i} ) \\
&=\sum_{i \in I}
\Biggl[\sum_{\omega\in A_{i}} X(\omega) \frac{P(\{\omega\} \cap A_{i})}{P(A_{i})}\Biggr]
P(A_{i})
\end{aligned}
から示され,2つ目の式は
\begin{aligned}
E[X]
&=\sum_{i \in I} \sum_{x\in X(\Omega)} x P\bigl(X^{-1}(x) \cap A_{i} \bigr) \\
&=\sum_{i \in I} \sum_{x\in X(\textcolor{red}{A_{i}})} x P\bigl(X^{-1}(x) \cap A_{i} \bigr) \\
&=\sum_{i \in I}
\Biggl[\sum_{x\in X(A_{i})} x \frac{P\bigl(X^{-1}(x) \cap A_{i} \bigr)}{P(A_{i})}\Biggr]
P(A_{i})
\end{aligned}
から示されます.

また,

\begin{aligned}
E[X,A_{i}]
&= \sum_{\omega\in A_{i}} X(\omega)P(\{\omega\})
\end{aligned}
\begin{aligned}
E[X|A_{i}]
&= \sum_{\omega \in A_{i}} X(\omega) P(\{\omega\} | A_{i}) \\
&= \sum_{\omega \in A_{i}} X(\omega) \frac{P(\{\omega\})}{P(A_{i})}
\end{aligned}
を見比べると
\begin{aligned}
E[X,A_{i}]
&= E[X|A_{i}] P(A_{i})
\end{aligned}
であることが読み取れます.

以上をまとめると,次が成り立ちます:

条件付き期待値による期待値の計算
$\displaystyle \Omega = \sum_{i\in I}A_{i}$と表せるとき,確率変数$X$の期待値は
\begin{aligned}
E[X]
&=\sum_{i \in I} E[X|A_{i}] P(A_{i})
\end{aligned}
と計算できる.ここで,
\begin{aligned}
E[X|A_{i}]
&=\sum_{\omega\in A_{i}} X(\omega) P(\{\omega\} | A_{i}) \\
&=\sum_{x\in X(A_{i})} x P(X^{-1}(x) | A_{i}) \\
&= \frac{E[X, A_{i}]}{P(A_{i})}
\end{aligned}
は事象$A_{i}$が起きたときの$X$の条件付き期待値である.


計算でよく使う性質を示しておきましょう.

条件付き期待値の性質
$\displaystyle A=\sum_{i\in I}B_{i}$であるとき,
\begin{aligned}
E[X|A]
&=\sum_{i\in I} E[X| A\cap B_{i}] P(B_{i}|A)
\end{aligned}
つまり,
\begin{aligned}
&(A\text{が起きた上での}X\text{の期待値}) \\
&=\sum_{i\in I} (A\cap B_{i}\text{が起きた上での}X\text{の期待値}) \\
&\qquad\quad \times (A\text{が起きたときに}B_{i}\text{が起こる確率})
\end{aligned}
【証明】
\begin{aligned}
E[X|A]
&=\frac{E[X, A]}{P(A)} \\
&=\frac{\sum_{i\in I} E[X, A\cap B_{i}]}{P(A)} \\
&=\frac{\sum_{i\in I} E[X| A\cap B_{i}] P (A\cap B_{i})}{P(A)} \\
&=\sum_{i\in I} E[X| A\cap B_{i}] P(B_{i}|A)
\end{aligned}

まとめ

  • 条件付き期待値は「ある事象の条件下での期待値」
  • 事象ごとに計算を分割する公式が利用できる
  • サイコロの具体例で直感的な理解が可能
  • 大学数学や競技プログラミングでよく出題される重要な概念


参考文献