条件付き期待値の計算例

POINT

  • 条件付き期待値を使った計算例.

2017年に賭ケグルイ双(スリーヒットダイス)を読んで書こうと思い,そのまま放置していたネタを引っ張り出してきました.
【関連記事】

条件付き期待値を使う理由

期待値の計算で
\begin{aligned}
(\text{期待値})
&=\sum_{A} (\overbrace{\text{事象$A$が起きたときの期待値}}^{\text{条件付き期待値}} ) \\
&\qquad\qquad \times (\text{事象$A$が起こる確率})
\end{aligned}
という関係式を使うと,直接計算するよりはるかに簡単に計算できる場合があります.

条件付き期待値とは

上の式を導出します.上の事実を認めて読み飛ばしてもOKです.

確率と期待値

まず,最低限必要な記法を整理します.

全事象かならる集合を$\Omega$で表します.事象$A\subset \Omega$の起こる確率は$P(A)$です.特に,$\omega \in \Omega$の起こる確率は$P(\{\omega\})$となります.

【例】
サイコロを例に考えてみます.目$i$が出る事象を$\omega_{i}$で表すと$\Omega=\{\omega_{1},\omega_{2},\omega_{3},\omega_{4},\omega_{5},\omega_{6}\}$で,偶数の出る事象$A=\{\omega_{2},\omega_{4},\omega_{6}\}$に対して$P(A)=1/2$です.また,各$\omega \in \Omega$に対して$P(\{\omega\})=1/6$です.


$\omega \in \Omega$に対して実数$X(\omega)$を対応させる関数$X$を実確率変数といいます.

【例】
サイコロの例で,$X(\omega_{i})=i$とすれば,$X$は各事象を出目に写す実確率変数です.


確率変数$X$の期待値は

\begin{aligned}
E[X]
&= \sum_{\omega\in\Omega} X(\omega)P(\{\omega\}) \\
&= \sum_{x\in X(\Omega)} x P\bigl(X^{-1}(x) \bigr)
\end{aligned}
と計算されます.2つ目の式は,$\sum_{i} i\times(\text{$i$の値をとる確率}) $を表しています(*1).高校数学から馴染みのある式だと思います.

【例】
サイコロの例で,上で$X(\omega_{i})=i$と定義した実確率変数を考えます.この期待値は(1つ目の表式でも2つ目の表式でも同じように計算でき)

\begin{aligned}
E[X]
&= \sum_{\omega\in\Omega} X(\omega)P(\{\omega\}) \\
&= \sum_{i=1}^{6} i \cdot \frac{1}{6}
\end{aligned}
となります.

次に,

\begin{aligned}
X(\omega_{i})
=
\begin{cases}
\, 1 & (i=2,4,6)\\
\, 0 & (i=1,3,5)
\end{cases}
\end{aligned}
を考えれば,$X$の期待値は「偶数の出る期待値」になります.2つ目の式を使えば
\begin{aligned}
E[X]
&=\sum_{i} i\times(\text{$X(\omega)=i$となる確率}) \\
&=1 \cdot P(\{2,4,6\}) + 0 \cdot P(\{1,3,5\}) \\
&=1/2
\end{aligned}
となります(高校数学での計算方法と同じです).

ここまで,確率変数$X$の期待値

\begin{aligned}
E[X]
&= \sum_{\omega\in\Omega} X(\omega)P(\{\omega\})
\end{aligned}
を考えてきました.和を取る範囲を$\Omega$ではなく,その部分集合$A\subset \Omega$としたものを考えることも多いので,記号
\begin{aligned}
E[X,\textcolor{red}{A}]
&= \sum_{\omega\in\textcolor{red}{A}} X(\omega)P(\{\omega\})
\end{aligned}
を導入しておきます.あとで出てくる条件付き期待値の記号$E[X|A]$と混同しないように注意してください.

条件付き期待値

$A_{i}\cap A_{j}=\empty\,(i\neq j)$である集合$\{A_{i}\}_{i}$によって$\Omega = \sum_{i}A_{i}$と表せるとすれば
\begin{aligned}
E[X]
&=\sum_{i} \sum_{\omega\in\Omega} X(\omega)P(\{\omega\} \cap A_{i}) \\
&=\sum_{i} \sum_{\omega\in\textcolor{red}{A_{i}}} X(\omega)P(\{\omega\} \cap A_{i} ) \\
&=\sum_{i}
\Biggl[\sum_{\omega\in A_{i}} X(\omega) \frac{P(\{\omega\} \cap A_{i})}{P(A_{i})}\Biggr]
P(A_{i})
\end{aligned}
あるいは
\begin{aligned}
E[X]
&=\sum_{i} \sum_{x\in X(\Omega)} x P\bigl(X^{-1}(x) \cap A_{i} \bigr) \\
&=\sum_{i} \sum_{x\in X(\textcolor{red}{A_{i}})} x P\bigl(X^{-1}(x) \cap A_{i} \bigr) \\
&=\sum_{i}
\Biggl[\sum_{x\in X(A_{i})} x \frac{P\bigl(X^{-1}(x) \cap A_{i} \bigr)}{P(A_{i})}\Biggr]
P(A_{i})
\end{aligned}
あるいは
\begin{aligned}
E[X]
&=\sum_{i} E[X, A_{i}] ​ \\
&=\sum_{i} \frac{E[X, A_{i}]}{P(A_{i})} ​P(A_{i})
\end{aligned}
と変形できます.

これら3つの式は,いずれも

\begin{aligned}
&\sum_{i} (\text{事象$A_{i}$の条件付き期待値}) \\
& \qquad \times (\text{事象$A_{i}$が起こる確率})
\end{aligned}
の形になっています.

条件付き確率の表式$P(B | A) = P(B \cap A)/P(A)$を使えば,次のようにまとめられます:

条件付き期待値による期待値の計算
$\Omega = \sum_{i}A_{i}$と表せるとき,確率変数$X$の期待値は
\begin{aligned}
E[X]
&=\sum_{i} E[X|A_{i}] P(A_{i})
\end{aligned}
と計算できる.ここで,
\begin{aligned}
E[X|A_{i}]
&=\sum_{\omega\in A_{i}} X(\omega) P(\{\omega\} | A_{i}) \\
&=\sum_{x\in X(A_{i})} x P(X^{-1}(x) | A_{i}) \\
&= \frac{E[X, A_{i}]}{P(A_{i})}
\end{aligned}
は事象$A_{i}$が起きたときの$X$の条件付き期待値である.
最後の$E[X|A_{i}]=E[X, A_{i}]/P(A_{i})$という表式は意味が取りにくいかもしれませんが,他の2式のように条件付き確率を使った期待値の計算に変形すれば,直感的にも理解できます.つまり,
\begin{aligned}
E[X|A]
&=(A\text{が起きたときの}X\text{の期待値})
\end{aligned}
となっています.


また,次の条件付き期待値の性質を計算で利用することが多いです.意味は

\begin{aligned}
&(A\text{が起きたときの}X\text{の期待値}) \\
&=\sum_{i} (A\cap B_{i}\text{が起きたときの}X\text{の期待値}) \\
&\qquad\quad \times (A\text{が起きたときに}B_{i}\text{が起こる確率})
\end{aligned}
です.
条件付き期待値の性質
$A=\sum_{i}B_{i}$と表せるとき
\begin{aligned}
E[X|A]
&=\sum_{i} E[X| A\cap B_{i}] P(B_{i}|A)
\end{aligned}
【証明】
\begin{aligned}
E[X|A]
&=\frac{E[X, A]}{P(A)} \\
&=\frac{\sum_{i} E[X, A\cap B_{i}]}{P(A)} \\
&=\frac{\sum_{i} E[X| A\cap B_{i}] P (A\cap B_{i})}{P(A)} \\
&=\sum_{i} E[X| A\cap B_{i}] P(B_{i}|A)
\end{aligned}

サイコロ2つの出た目の積

Wikipediaの例です.サイコロを2回振り,出た目の積の期待値を計算します.$i$の目が出る確率を$P(\{i\})$とします.

定義から

\begin{aligned}
E
&= \sum_{i,j=1}^{6} ij P(\{i\})P(\{j\})
\end{aligned}
と計算できますが,$6\times 6=36$通りの積をすべて求めて足し上げるのは面倒です.

そこで,(期待値) = Σ(1回目に$i$が出たときの条件付き期待値)×(1回目に$i$が出る確率)と計算します.

式変形をすると自然に条件付き期待値が現れます.つまり,

\begin{aligned}
E
&= \sum_{i=1}^{6} \biggl[\sum_{j=1}^{6} ij P(\{j\}) \biggr] P(\{i\})
\end{aligned}
とすれば,$[\cdots ]$内は「1回目に$i$が出たときの条件付き期待値」となっています.

特に,全ての目が$1/6$の確率で出る場合,条件付き期待値は

\begin{aligned}
[\cdots ]
&=\sum_{j=1}^{6} ij \frac{1}{6} \\
&=\frac{i}{6} \cdot \frac{6\cdot 7}{2} \\
&=\frac{7}{2} i
\end{aligned}
と計算できます.さらに,期待値は
\begin{aligned}
E
&= \sum_{i=1}^{6}[\cdots ] P(\{i\}) \\
&= \sum_{i=1}^{6} \frac{7}{2} i \cdot \frac{1}{6} \\
&=\frac{7}{2} \cdot \frac{7}{2} \\
&=\frac{49}{4}
\end{aligned}
となります.

このように,条件付き期待値を使うことで,36通りの数え上げをせずに済みました.

【補足】
最初に導いた条件付き期待値の式をもとに計算することで,上の計算との対応を確かめます.

まずは,もう一度考えている問題を整理しましょう.1回目に$i$,2回目に$j$が出る確率を$\tilde{P}(\{(i,j)\})$とすれば,

\begin{aligned}
\tilde{P}(\{(i,j)\})
&=P(\{i\}) P(\{j\})
\end{aligned}
です.そして,求める確率変数$Z(i,j)=ij$の期待値は
\begin{aligned}
E[Z]
&=\sum_{(i,j)\in\Omega} Z(i,j) \tilde{P}(\{(i,j)\}) \\
&=\sum_{(i,j)\in\Omega} ij P(\{i\}) P(\{j\})
\end{aligned}
と表せます.先程の計算では,いきなり最後の表式で考えたため,$Z, \tilde{P}$は現れませんでした.

上で導いた一般的な条件付き確率の式の$X,P$がそれぞれ$Z, \tilde{P}$に対応しています.

確率変数$Z$の条件付き期待値は

\begin{aligned}
& E[ij|\text{1回目$=i$}] \\
&=\sum_{(i^{\prime},j)\in\Omega} i^{\prime}j \tilde{P}\bigl(\{(i^{\prime},j)\}|\text{1回目$=i$}\bigr)
\end{aligned}
となります(もう少し数学っぽく書くと
\begin{aligned}
&E[Z | \{i\} \times \Omega] \\
&=\sum_{(i^{\prime},j)\in\Omega} Z(i^{\prime},j) \tilde{P}(\{(i^{\prime},j)\} | \{i\} \times \Omega )
\end{aligned}
です).

ここで,

\begin{aligned}
&\tilde{P}\bigl(\{(i^{\prime},j)\}|\text{1回目$=i$}\bigr) \\
&=
\begin{cases}
\, 0 & (i^{\prime} \neq i)\\
\, P(\{j\}) & (i^{\prime} = i)
\end{cases}
\end{aligned}
となる(※)ことから,
\begin{aligned}
& E[ij|\text{1回目$=i$}] \\
&=\sum_{i^{\prime},j} i^{\prime} j \tilde{P}\bigl(\{(i^{\prime},j)\}|\text{1回目$=i$}\bigr) \\
&=\sum_{j} i j P(\{j\})
\end{aligned}
なので,上の$[\cdots ]$と一致しました.

※:このくらいなら直感的に求めることが多いかもしれませんが,数式で理解するには条件付き確率の定義

\begin{aligned}
&\tilde{P}\bigl(\{(i^{\prime},j)\}|\text{1回目$=i$}\bigr) \\
&=\frac{\tilde{P}\bigl(\{(i^{\prime},j)\}\cap \text{1回目$=i$}\bigr)}{\tilde{P}(\text{1回目$=i$})}
\end{aligned}
に立ち返り,
\begin{aligned}
& \tilde{P}\bigl(\{(i^{\prime},j)\}\cap \text{1回目$=i$}\bigr) \\
&=
\begin{cases}
\, 0 & (i^{\prime} \neq i)\\
\, \tilde{P}\bigl(\{(i,j)\}) = P(\{i\}) P(\{j\})& (i^{\prime} = i)
\end{cases} \\
&\tilde{P}(\text{1回目$=i$})
= P(\{i\})
\end{aligned}
を利用すれば良いです.

事象が起こるまでの試行回数

詳しくは,関連記事[A]で扱っています.

事象が起こるまでの試行回数
確率$0 < p < 1$で成功する試行を成功するまで繰り返し,成功した時点で終了する.このとき,終了するまでの試行回数の期待値は$1/p$である.
【略解】
\begin{aligned}
E[X]
&=E[X| \text{1回目に成功}]\cdot P(\text{1回目に成功}) \\
& \quad + E[X| \text{1回目に失敗}]\cdot P(\text{1回目に失敗}) \\
&=1\cdot p + (1 + E[X])\cdot (1-p) \\
&=1+(1-p)E[X]
\end{aligned}
です.これを$E[X]$について解けば
\begin{aligned}
E[X] = 1/p
\end{aligned}
が得られます.//


スリーヒットダイス | 賭ケグルイ双

賭ケグルイ双というマンガに「スリーヒットダイス」というゲームがあります.
賭ケグルイ双 1巻 (デジタル版ガンガンコミックスJOKER)

このゲームを単純にすると,

ゲーム内容

  1. 2プレーヤーが「連続する3回のコイントスの結果」を予想する.
  2. どちらかの予想した並びが出るまで,連続してコイントスを行う.
  3. 予想した並びが出た方の勝ちとなる.
というものです(実際はダイスの1, 2, 3をDOWN,4, 5, 6をUPとしています).以下,表をU,裏をDと表しましょう.

さて,どのような並びを予想すれば良いでしょうか?
あれ?どんな組み合わせでも同じでは?と思いませんか?


しかし,このマンガの中では,

  • どんな目を予想しても$\frac{1}{2}\times \frac{1}{2}\times \frac{1}{2} = \frac{1}{8}$というのはマチガイ!
  • DDD・UUUが出る試行回数の期待値が14
  • UUD・UDD・DDU・DUUが出る試行回数の期待値が8
ということが指摘されています.

具体的に期待値を計算し,これを確かめてみましょう.せっかくなので,Uの出る確率を$p$,Dの出る確率を$(1-p)$として計算して,最後に$p=1/2$とします.

【注1】UとDを反転させた結果は,$p\to (1-p)$とすれば求められます.

【注2】結果を他の文献等で確かめてはいないので,ミスがあるかもしれません.ヘンなところを見つけたら,教えて下さい.

【注3】確率漸化式で解こうとすると,とんでもなく面倒くさいことになります(詳しくは参考記事を見てください).気が向いたら,計算を記事にするかもしれません(放置するパターン...).

UUUの期待値

UUUの期待値を求めます.DDDの期待値は,得られた結果で$p\to (1-p)$と置き換えれば得られます.

まず,先程と同様に

\begin{aligned}
E[X]
&=E[X| UUU]\cdot P(UUU) \\
& \quad + E[X| UUD]\cdot P(UUD) \\
& \quad + E[X| UD*]\cdot P(UD*) \\
& \quad + E[X| D**]\cdot P(D**)
\end{aligned}
と変形します.ここで,$*$は未確定部分を表します.例えば$D**$は「1回目に裏」という事象の集合を表します(起こり得る全ての事象について和をとっていると思っても良いです).$*$は文字が3個に満たないときに見やすいようにつけているだけで,$UD*$は$UD$と同じ意味であり,$D**$は$D$と同じ意味です.同様に,$UUU$の後ろには無限個の$*$がついているとみなすこともできます.

ここで

\begin{aligned}
&
\begin{cases}
\, E[X| UUU] = 3 \\
\, E[X| UUD] = 3 + E[X] \\
\, E[X| UD*] = 2 + E[X] \\
\, E[X| D**] = 1 + E[X]
\end{cases}\\
&
\begin{cases}
\, P(UUU) = p^{3} \\
\, P(UUD) = p^{2}(1-p) \\
\, P(UD*) = p (1-p) \\
\, P(D**) = (1-p)
\end{cases}
\end{aligned}
なので,
\begin{aligned}
E[X]
&=3 p^{3} \\
&\quad + (3 + E[X])p^{2}(1-p) \\
&\quad + (2 + E[X])p (1-p) \\
&\quad + (1 + E[X])(1-p)
\end{aligned}
となります.これを解くと
\begin{aligned}
E[X]=\frac{p^{2}+p+1}{p^{3}}
\end{aligned}
が導けます.もし,$p=1/2$であれば$E[X]=14$となります.

UUDの期待値

UUDの期待値を求めます.

\begin{aligned}
E[X]
&=E[X| UUD]\cdot P(UUD) \\
& \quad + E[X| UUU]\cdot P(UUU) \\
& \quad + E[X| UD*]\cdot P(UD*) \\
& \quad + E[X| D**]\cdot P(D**) \\
&=3p^{2}(1-p) \\
&\quad + E[X| UUU]\cdot p^{3} \\
&\quad + (2 + E[X])p (1-p) \\
&\quad + (1 + E[X])(1-p)
\end{aligned}

ここで,$E[X| UUU]$は,他と違って初期状態にリセットされないので$E[X]$を用いて表すことができません.そこで,「条件付き期待値の性質」の式$E[X|A]=\sum_{i} E[X| A\cap B_{i}] P(B_{i}|A)$を使ってこの値を求めます.つまり,もう1ステップ進めれば

\begin{aligned}
&E[X| UUU] \\
&=E[X| UUUU] \cdot P(UUUU|UUU) \\
&\qquad +E[X| UUUD] \cdot P(UUUD|UUU) \\
&=(1+E[X| UUU]) p + 4(1-p)
\end{aligned}
なので,
\begin{aligned}
E[X| UUU]
= \frac{4-3p}{1-p}
\end{aligned}
であることがわかります.

これを上式に代入して計算すると,

\begin{aligned}
E[X] = \frac{1}{p^{2}(1-p)}
\end{aligned}
となります.特に,$p=1/2$の場合には$E[X]=8$です.

UDUの期待値

UDUの期待値を求めます.

\begin{aligned}
E[X]
&=E[X| UDU]\cdot P(UDU) \\
& \quad + E[X| UDD]\cdot P(UDD) \\
& \quad + E[X| UU*]\cdot P(UU*) \\
& \quad + E[X| D**]\cdot P(D**) \\
&=3p^{2}(1-p) \\
&\quad + (3 + E[X])p(1-p)^{2} \\
&\quad + E[X| UU*]\cdot p^{2} \\
&\quad + (1 + E[X])(1-p)
\end{aligned}

今度は$E[X| UU*]$が初期化されないので,別途求めます.前と同様に

\begin{aligned}
&E[X| UU*] \\
&=E[X|UUU]P(UUU|UU) \\
&\qquad + E[X|UUDU]P(UUDU|UU) \\
&\qquad + E[X|UUDD]P(UUDD|UU) \\
&=(1+E[X| UU*])p \\
&\qquad + 4p(1-p) \\
&\qquad + (4+E[X])(1-p)^{2}
\end{aligned}
より,
\begin{aligned}
E[X| UU*]
&=\frac{4-3p}{1-p} + E[X](1-p)
\end{aligned}
となります.

これを上式に代入して$E[X]$を求めると

\begin{aligned}
E[X]
&=\frac{p(1-p)+1}{p^{2}(1-p)}
\end{aligned}
となります.特に,$p=1/2$の場合には$E[X]=10$です.

DUUの期待値

DUUの期待値を求めます.

\begin{aligned}
E[X]
&=E[X| DUU]\cdot P(DUU) \\
& \quad + E[X| DUD]\cdot P(DUD) \\
& \quad + E[X| DD*]\cdot P(DD*) \\
& \quad + E[X| U**]\cdot P(U**) \\
&=3p^{2}(1-p) \\
&\quad + E[X| DUD] \cdot p (1-p)^{2}\\
&\quad + E[X| DD*]\cdot (1-p)^{2} \\
&\quad + (1 + E[X])p
\end{aligned}

ここで,

\begin{aligned}
&E[X| DUD] \\
&=E[X| DUDUU] \cdot P(DUDUU|DUD) \\
&\quad + E[X| DUDUD] \cdot P(DUDUD|DUD) \\
&\quad + E[X| DUDD] \cdot P(DUDD|DUD) \\
&=5p^{2} \\
&\quad + (2 + E[X| DUD])p(1-p) \\
&\quad + (2 + E[X|DD*]) (1-p)
\end{aligned}
より
\begin{aligned}
[1 - p(1-p)]E[X| DUD] - (1-p)E[X| DD*] &\\
=3p^{2} + 2 &
\end{aligned}
さらに,
\begin{aligned}
&E[X| DD*] \\
&=E[X| DDUU]\cdot P(DDUU|DD) \\
&\quad + E[X| DDUD]\cdot P(DDUD|DD) \\
&\quad + E[X| DDD]\cdot P(DDD|DD) \\
&=4p^{2} \\
&\quad + (1 + E[X|DUD])p(1-p) \\
&\quad + (1 + E[X| DD*])(1-p)
\end{aligned}
より
\begin{aligned}
-p(1-p)E[X|DUD] + pE[X| DD*] & \\
=3p^{2}+1 &
\end{aligned}
となります.連立方程式を解くと
\begin{aligned}
E[X|DUD] &= \frac{3p^{2}+p+1}{p^{2}} \\
E[X| DD*] &= \frac{2p^{2}+p+1}{p^{2}}
\end{aligned}
が得られます.

これを上式に代入すると,

\begin{aligned}
E[X] = \frac{1}{p^{2}(1-p)}
\end{aligned}
となります.特に,$p=1/2$の場合には$E[X]=8$です.

【参考記事】

  • 期待値と条件付確率 - math314のブログ:とても参考になります.最初,確率漸化式で計算しようとしたのですが,あまりの面倒臭さから他の方法を探す中で辿り着きました.この記事で,条件付き期待値の有効性を知りました.2017年にEvernoteのクリップしたまま忘れていたのですが,今回引っ張り出して参考にしました.

参考文献/記事

【AtCoderの問題例】

*1:$X^{-1}(x)$は$X(\omega)=x$となる全ての$\omega \in \Omega$からなる集合.ちゃんと書くと,$X^{-1}(x)=\{\omega\in\Omega\mid X(\omega)=x\}$.