- 条件付き期待値を使った計算例.
【関連記事】
条件付き期待値を使う理由
期待値の計算で(\text{期待値})
&=\sum_{A} (\overbrace{\text{事象$A$が起きたときの期待値}}^{\text{条件付き期待値}} ) \\
&\qquad\qquad \times (\text{事象$A$が起こる確率})
\end{aligned}
条件付き期待値とは
上の式を導出します.上の事実を認めて読み飛ばしてもOKです.確率と期待値
まず,最低限必要な記法を整理します.全事象かならる集合を$\Omega$で表します.事象$A\subset \Omega$の起こる確率は$P(A)$です.特に,$\omega \in \Omega$の起こる確率は$P(\{\omega\})$となります.
【例】
サイコロを例に考えてみます.目$i$が出る事象を$\omega_{i}$で表すと$\Omega=\{\omega_{1},\omega_{2},\omega_{3},\omega_{4},\omega_{5},\omega_{6}\}$で,偶数の出る事象$A=\{\omega_{2},\omega_{4},\omega_{6}\}$に対して$P(A)=1/2$です.また,各$\omega \in \Omega$に対して$P(\{\omega\})=1/6$です.
$\omega \in \Omega$に対して実数$X(\omega)$を対応させる関数$X$を実確率変数といいます.
【例】
サイコロの例で,$X(\omega_{i})=i$とすれば,$X$は各事象を出目に写す実確率変数です.
確率変数$X$の期待値は
E[X]
&= \sum_{\omega\in\Omega} X(\omega)P(\{\omega\}) \\
&= \sum_{x\in X(\Omega)} x P\bigl(X^{-1}(x) \bigr)
\end{aligned}
【例】
サイコロの例で,上で$X(\omega_{i})=i$と定義した実確率変数を考えます.この期待値は(1つ目の表式でも2つ目の表式でも同じように計算でき)
E[X]
&= \sum_{\omega\in\Omega} X(\omega)P(\{\omega\}) \\
&= \sum_{i=1}^{6} i \cdot \frac{1}{6}
\end{aligned}
次に,
X(\omega_{i})
=
\begin{cases}
\, 1 & (i=2,4,6)\\
\, 0 & (i=1,3,5)
\end{cases}
\end{aligned}
E[X]
&=\sum_{i} i\times(\text{$X(\omega)=i$となる確率}) \\
&=1 \cdot P(\{2,4,6\}) + 0 \cdot P(\{1,3,5\}) \\
&=1/2
\end{aligned}
ここまで,確率変数$X$の期待値
E[X]
&= \sum_{\omega\in\Omega} X(\omega)P(\{\omega\})
\end{aligned}
E[X,\textcolor{red}{A}]
&= \sum_{\omega\in\textcolor{red}{A}} X(\omega)P(\{\omega\})
\end{aligned}
条件付き期待値
$A_{i}\cap A_{j}=\empty\,(i\neq j)$である集合$\{A_{i}\}_{i}$によって$\Omega = \sum_{i}A_{i}$と表せるとすればE[X]
&=\sum_{i} \sum_{\omega\in\Omega} X(\omega)P(\{\omega\} \cap A_{i}) \\
&=\sum_{i} \sum_{\omega\in\textcolor{red}{A_{i}}} X(\omega)P(\{\omega\} \cap A_{i} ) \\
&=\sum_{i}
\Biggl[\sum_{\omega\in A_{i}} X(\omega) \frac{P(\{\omega\} \cap A_{i})}{P(A_{i})}\Biggr]
P(A_{i})
\end{aligned}
E[X]
&=\sum_{i} \sum_{x\in X(\Omega)} x P\bigl(X^{-1}(x) \cap A_{i} \bigr) \\
&=\sum_{i} \sum_{x\in X(\textcolor{red}{A_{i}})} x P\bigl(X^{-1}(x) \cap A_{i} \bigr) \\
&=\sum_{i}
\Biggl[\sum_{x\in X(A_{i})} x \frac{P\bigl(X^{-1}(x) \cap A_{i} \bigr)}{P(A_{i})}\Biggr]
P(A_{i})
\end{aligned}
E[X]
&=\sum_{i} E[X, A_{i}] \\
&=\sum_{i} \frac{E[X, A_{i}]}{P(A_{i})} P(A_{i})
\end{aligned}
これら3つの式は,いずれも
&\sum_{i} (\text{事象$A_{i}$の条件付き期待値}) \\
& \qquad \times (\text{事象$A_{i}$が起こる確率})
\end{aligned}
条件付き確率の表式$P(B | A) = P(B \cap A)/P(A)$を使えば,次のようにまとめられます:
E[X]
&=\sum_{i} E[X|A_{i}] P(A_{i})
\end{aligned}
E[X|A_{i}]
&=\sum_{\omega\in A_{i}} X(\omega) P(\{\omega\} | A_{i}) \\
&=\sum_{x\in X(A_{i})} x P(X^{-1}(x) | A_{i}) \\
&= \frac{E[X, A_{i}]}{P(A_{i})}
\end{aligned}
E[X|A]
&=(A\text{が起きたときの}X\text{の期待値})
\end{aligned}
また,次の条件付き期待値の性質を計算で利用することが多いです.意味は
&(A\text{が起きたときの}X\text{の期待値}) \\
&=\sum_{i} (A\cap B_{i}\text{が起きたときの}X\text{の期待値}) \\
&\qquad\quad \times (A\text{が起きたときに}B_{i}\text{が起こる確率})
\end{aligned}
E[X|A]
&=\sum_{i} E[X| A\cap B_{i}] P(B_{i}|A)
\end{aligned}
E[X|A]
&=\frac{E[X, A]}{P(A)} \\
&=\frac{\sum_{i} E[X, A\cap B_{i}]}{P(A)} \\
&=\frac{\sum_{i} E[X| A\cap B_{i}] P (A\cap B_{i})}{P(A)} \\
&=\sum_{i} E[X| A\cap B_{i}] P(B_{i}|A)
\end{aligned}
サイコロ2つの出た目の積
Wikipediaの例です.サイコロを2回振り,出た目の積の期待値を計算します.$i$の目が出る確率を$P(\{i\})$とします.定義から
E
&= \sum_{i,j=1}^{6} ij P(\{i\})P(\{j\})
\end{aligned}
そこで,(期待値) = Σ(1回目に$i$が出たときの条件付き期待値)×(1回目に$i$が出る確率)と計算します.
式変形をすると自然に条件付き期待値が現れます.つまり,
E
&= \sum_{i=1}^{6} \biggl[\sum_{j=1}^{6} ij P(\{j\}) \biggr] P(\{i\})
\end{aligned}
特に,全ての目が$1/6$の確率で出る場合,条件付き期待値は
[\cdots ]
&=\sum_{j=1}^{6} ij \frac{1}{6} \\
&=\frac{i}{6} \cdot \frac{6\cdot 7}{2} \\
&=\frac{7}{2} i
\end{aligned}
E
&= \sum_{i=1}^{6}[\cdots ] P(\{i\}) \\
&= \sum_{i=1}^{6} \frac{7}{2} i \cdot \frac{1}{6} \\
&=\frac{7}{2} \cdot \frac{7}{2} \\
&=\frac{49}{4}
\end{aligned}
このように,条件付き期待値を使うことで,36通りの数え上げをせずに済みました.
【補足】
最初に導いた条件付き期待値の式をもとに計算することで,上の計算との対応を確かめます.
まずは,もう一度考えている問題を整理しましょう.1回目に$i$,2回目に$j$が出る確率を$\tilde{P}(\{(i,j)\})$とすれば,
\tilde{P}(\{(i,j)\})
&=P(\{i\}) P(\{j\})
\end{aligned}
E[Z]
&=\sum_{(i,j)\in\Omega} Z(i,j) \tilde{P}(\{(i,j)\}) \\
&=\sum_{(i,j)\in\Omega} ij P(\{i\}) P(\{j\})
\end{aligned}
上で導いた一般的な条件付き確率の式の$X,P$がそれぞれ$Z, \tilde{P}$に対応しています.
確率変数$Z$の条件付き期待値は
& E[ij|\text{1回目$=i$}] \\
&=\sum_{(i^{\prime},j)\in\Omega} i^{\prime}j \tilde{P}\bigl(\{(i^{\prime},j)\}|\text{1回目$=i$}\bigr)
\end{aligned}
&E[Z | \{i\} \times \Omega] \\
&=\sum_{(i^{\prime},j)\in\Omega} Z(i^{\prime},j) \tilde{P}(\{(i^{\prime},j)\} | \{i\} \times \Omega )
\end{aligned}
ここで,
&\tilde{P}\bigl(\{(i^{\prime},j)\}|\text{1回目$=i$}\bigr) \\
&=
\begin{cases}
\, 0 & (i^{\prime} \neq i)\\
\, P(\{j\}) & (i^{\prime} = i)
\end{cases}
\end{aligned}
& E[ij|\text{1回目$=i$}] \\
&=\sum_{i^{\prime},j} i^{\prime} j \tilde{P}\bigl(\{(i^{\prime},j)\}|\text{1回目$=i$}\bigr) \\
&=\sum_{j} i j P(\{j\})
\end{aligned}
※:このくらいなら直感的に求めることが多いかもしれませんが,数式で理解するには条件付き確率の定義
&\tilde{P}\bigl(\{(i^{\prime},j)\}|\text{1回目$=i$}\bigr) \\
&=\frac{\tilde{P}\bigl(\{(i^{\prime},j)\}\cap \text{1回目$=i$}\bigr)}{\tilde{P}(\text{1回目$=i$})}
\end{aligned}
& \tilde{P}\bigl(\{(i^{\prime},j)\}\cap \text{1回目$=i$}\bigr) \\
&=
\begin{cases}
\, 0 & (i^{\prime} \neq i)\\
\, \tilde{P}\bigl(\{(i,j)\}) = P(\{i\}) P(\{j\})& (i^{\prime} = i)
\end{cases} \\
&\tilde{P}(\text{1回目$=i$})
= P(\{i\})
\end{aligned}
事象が起こるまでの試行回数
詳しくは,関連記事[A]で扱っています.E[X]
&=E[X| \text{1回目に成功}]\cdot P(\text{1回目に成功}) \\
& \quad + E[X| \text{1回目に失敗}]\cdot P(\text{1回目に失敗}) \\
&=1\cdot p + (1 + E[X])\cdot (1-p) \\
&=1+(1-p)E[X]
\end{aligned}
E[X] = 1/p
\end{aligned}
スリーヒットダイス | 賭ケグルイ双
賭ケグルイ双というマンガに「スリーヒットダイス」というゲームがあります.賭ケグルイ双 1巻 (デジタル版ガンガンコミックスJOKER)
このゲームを単純にすると,
- 2プレーヤーが「連続する3回のコイントスの結果」を予想する.
- どちらかの予想した並びが出るまで,連続してコイントスを行う.
- 予想した並びが出た方の勝ちとなる.
さて,どのような並びを予想すれば良いでしょうか?
あれ?どんな組み合わせでも同じでは?と思いませんか?
しかし,このマンガの中では,
- どんな目を予想しても$\frac{1}{2}\times \frac{1}{2}\times \frac{1}{2} = \frac{1}{8}$というのはマチガイ!
- DDD・UUUが出る試行回数の期待値が14
- UUD・UDD・DDU・DUUが出る試行回数の期待値が8
具体的に期待値を計算し,これを確かめてみましょう.せっかくなので,Uの出る確率を$p$,Dの出る確率を$(1-p)$として計算して,最後に$p=1/2$とします.
【注1】UとDを反転させた結果は,$p\to (1-p)$とすれば求められます.
【注2】結果を他の文献等で確かめてはいないので,ミスがあるかもしれません.ヘンなところを見つけたら,教えて下さい.
【注3】確率漸化式で解こうとすると,とんでもなく面倒くさいことになります(詳しくは参考記事を見てください).気が向いたら,計算を記事にするかもしれません(放置するパターン...).
➡考えてくれた方がいました!:スリーヒットダイス|朱理
UUUの期待値
UUUの期待値を求めます.DDDの期待値は,得られた結果で$p\to (1-p)$と置き換えれば得られます.まず,先程と同様に
E[X]
&=E[X| UUU]\cdot P(UUU) \\
& \quad + E[X| UUD]\cdot P(UUD) \\
& \quad + E[X| UD*]\cdot P(UD*) \\
& \quad + E[X| D**]\cdot P(D**)
\end{aligned}
ここで
&
\begin{cases}
\, E[X| UUU] = 3 \\
\, E[X| UUD] = 3 + E[X] \\
\, E[X| UD*] = 2 + E[X] \\
\, E[X| D**] = 1 + E[X]
\end{cases}\\
&
\begin{cases}
\, P(UUU) = p^{3} \\
\, P(UUD) = p^{2}(1-p) \\
\, P(UD*) = p (1-p) \\
\, P(D**) = (1-p)
\end{cases}
\end{aligned}
E[X]
&=3 p^{3} \\
&\quad + (3 + E[X])p^{2}(1-p) \\
&\quad + (2 + E[X])p (1-p) \\
&\quad + (1 + E[X])(1-p)
\end{aligned}
E[X]=\frac{p^{2}+p+1}{p^{3}}
\end{aligned}
UUDの期待値
UUDの期待値を求めます.E[X]
&=E[X| UUD]\cdot P(UUD) \\
& \quad + E[X| UUU]\cdot P(UUU) \\
& \quad + E[X| UD*]\cdot P(UD*) \\
& \quad + E[X| D**]\cdot P(D**) \\
&=3p^{2}(1-p) \\
&\quad + E[X| UUU]\cdot p^{3} \\
&\quad + (2 + E[X])p (1-p) \\
&\quad + (1 + E[X])(1-p)
\end{aligned}
ここで,$E[X| UUU]$は,他と違って初期状態にリセットされないので$E[X]$を用いて表すことができません.そこで,「条件付き期待値の性質」の式$E[X|A]=\sum_{i} E[X| A\cap B_{i}] P(B_{i}|A)$を使ってこの値を求めます.つまり,もう1ステップ進めれば
&E[X| UUU] \\
&=E[X| UUUU] \cdot P(UUUU|UUU) \\
&\qquad +E[X| UUUD] \cdot P(UUUD|UUU) \\
&=(1+E[X| UUU]) p + 4(1-p)
\end{aligned}
E[X| UUU]
= \frac{4-3p}{1-p}
\end{aligned}
これを上式に代入して計算すると,
E[X] = \frac{1}{p^{2}(1-p)}
\end{aligned}
UDUの期待値
UDUの期待値を求めます.E[X]
&=E[X| UDU]\cdot P(UDU) \\
& \quad + E[X| UDD]\cdot P(UDD) \\
& \quad + E[X| UU*]\cdot P(UU*) \\
& \quad + E[X| D**]\cdot P(D**) \\
&=3p^{2}(1-p) \\
&\quad + (3 + E[X])p(1-p)^{2} \\
&\quad + E[X| UU*]\cdot p^{2} \\
&\quad + (1 + E[X])(1-p)
\end{aligned}
今度は$E[X| UU*]$が初期化されないので,別途求めます.前と同様に
&E[X| UU*] \\
&=E[X|UUU]P(UUU|UU) \\
&\qquad + E[X|UUDU]P(UUDU|UU) \\
&\qquad + E[X|UUDD]P(UUDD|UU) \\
&=(1+E[X| UU*])p \\
&\qquad + 4p(1-p) \\
&\qquad + (4+E[X])(1-p)^{2}
\end{aligned}
E[X| UU*]
&=\frac{4-3p}{1-p} + E[X](1-p)
\end{aligned}
これを上式に代入して$E[X]$を求めると
E[X]
&=\frac{p(1-p)+1}{p^{2}(1-p)}
\end{aligned}
DUUの期待値
DUUの期待値を求めます.E[X]
&=E[X| DUU]\cdot P(DUU) \\
& \quad + E[X| DUD]\cdot P(DUD) \\
& \quad + E[X| DD*]\cdot P(DD*) \\
& \quad + E[X| U**]\cdot P(U**) \\
&=3p^{2}(1-p) \\
&\quad + E[X| DUD] \cdot p (1-p)^{2}\\
&\quad + E[X| DD*]\cdot (1-p)^{2} \\
&\quad + (1 + E[X])p
\end{aligned}
ここで,
&E[X| DUD] \\
&=E[X| DUDUU] \cdot P(DUDUU|DUD) \\
&\quad + E[X| DUDUD] \cdot P(DUDUD|DUD) \\
&\quad + E[X| DUDD] \cdot P(DUDD|DUD) \\
&=5p^{2} \\
&\quad + (2 + E[X| DUD])p(1-p) \\
&\quad + (2 + E[X|DD*]) (1-p)
\end{aligned}
[1 - p(1-p)]E[X| DUD] - (1-p)E[X| DD*] &\\
=3p^{2} + 2 &
\end{aligned}
&E[X| DD*] \\
&=E[X| DDUU]\cdot P(DDUU|DD) \\
&\quad + E[X| DDUD]\cdot P(DDUD|DD) \\
&\quad + E[X| DDD]\cdot P(DDD|DD) \\
&=4p^{2} \\
&\quad + (1 + E[X|DUD])p(1-p) \\
&\quad + (1 + E[X| DD*])(1-p)
\end{aligned}
-p(1-p)E[X|DUD] + pE[X| DD*] & \\
=3p^{2}+1 &
\end{aligned}
E[X|DUD] &= \frac{3p^{2}+p+1}{p^{2}} \\
E[X| DD*] &= \frac{2p^{2}+p+1}{p^{2}}
\end{aligned}
これを上式に代入すると,
E[X] = \frac{1}{p^{2}(1-p)}
\end{aligned}
【参考記事】
- 期待値と条件付確率 - math314のブログ:とても参考になります.最初,確率漸化式で計算しようとしたのですが,あまりの面倒臭さから他の方法を探す中で辿り着きました.この記事で,条件付き期待値の有効性を知りました.2017年にEvernoteのクリップしたまま忘れていたのですが,今回引っ張り出して参考にしました.
参考文献/記事
【AtCoderの問題例】
*1:$X^{-1}(x)$は$X(\omega)=x$となる全ての$\omega \in \Omega$からなる集合.ちゃんと書くと,$X^{-1}(x)=\{\omega\in\Omega\mid X(\omega)=x\}$.