賭ケグルイ双というマンガに「スリーヒットダイス」というゲームがあります.
このゲームを単純にすると,
ゲーム内容
- 2プレーヤーが「連続する3回のコイントスの結果」を予想する.
- どちらかの予想した並びが出るまで,連続してコイントスを行う.
- 先に予想した並びが出た方の勝ちとなる.
さて,どのような並びを予想すれば良いでしょうか?
あれ?どんな組み合わせでも同じでは?と思いませんか?
しかし,このマンガの中では,
- どんな目を予想しても$\frac{1}{2}\times \frac{1}{2}\times \frac{1}{2} = \frac{1}{8}$というのはマチガイ!
- DDD・UUUが出る試行回数の期待値が14
- UUD・UDD・DDU・DUUが出る試行回数の期待値が8
今回は「条件付き期待値」を使って計算しましたが,マルコフ連鎖を使って計算することもできます.
➡コイントスのパターンとマルコフ連鎖 - Notes_JP
条件付き期待値については以下の記事を参照してください.
➡条件付き期待値とは?定義と計算例 - Notes_JP
問題設定
Uの出る確率を$p$,Dの出る確率を$(1-p)$として計算して,最後に$p=1/2$とします.※ UとDを反転させた結果は,$p\to (1-p)$とすれば求められます.
期待値の計算
条件付き期待値を使って,期待値を計算します.UUUの期待値
UUUの期待値を求めます.DDDの期待値は,得られた結果で$p\to (1-p)$と置き換えれば得られます.まず,先程と同様に
\begin{aligned}
E[X]
&=E[X| UUU]\cdot P(UUU) \\
& \quad + E[X| UUD]\cdot P(UUD) \\
& \quad + E[X| UD*]\cdot P(UD*) \\
& \quad + E[X| D**]\cdot P(D**)
\end{aligned}
と変形します.ここで,$*$は未確定部分を表します.例えば$D**$は「1回目に裏」という事象の集合を表します(起こり得る全ての事象について和をとっていると思っても良いです).$*$は文字が3個に満たないときに見やすいようにつけているだけで,$UD*$は$UD$と同じ意味であり,$D**$は$D$と同じ意味です.同様に,$UUU$の後ろには無限個の$*$がついているとみなすこともできます.E[X]
&=E[X| UUU]\cdot P(UUU) \\
& \quad + E[X| UUD]\cdot P(UUD) \\
& \quad + E[X| UD*]\cdot P(UD*) \\
& \quad + E[X| D**]\cdot P(D**)
\end{aligned}
ここで
\begin{aligned}
&
\begin{cases}
\, E[X| UUU] = 3 \\
\, E[X| UUD] = 3 + E[X] \\
\, E[X| UD*] = 2 + E[X] \\
\, E[X| D**] = 1 + E[X]
\end{cases}\\
&
\begin{cases}
\, P(UUU) = p^{3} \\
\, P(UUD) = p^{2}(1-p) \\
\, P(UD*) = p (1-p) \\
\, P(D**) = (1-p)
\end{cases}
\end{aligned}
なので,&
\begin{cases}
\, E[X| UUU] = 3 \\
\, E[X| UUD] = 3 + E[X] \\
\, E[X| UD*] = 2 + E[X] \\
\, E[X| D**] = 1 + E[X]
\end{cases}\\
&
\begin{cases}
\, P(UUU) = p^{3} \\
\, P(UUD) = p^{2}(1-p) \\
\, P(UD*) = p (1-p) \\
\, P(D**) = (1-p)
\end{cases}
\end{aligned}
\begin{aligned}
E[X]
&=3 p^{3} \\
&\quad + (3 + E[X])p^{2}(1-p) \\
&\quad + (2 + E[X])p (1-p) \\
&\quad + (1 + E[X])(1-p)
\end{aligned}
となります.これを解くとE[X]
&=3 p^{3} \\
&\quad + (3 + E[X])p^{2}(1-p) \\
&\quad + (2 + E[X])p (1-p) \\
&\quad + (1 + E[X])(1-p)
\end{aligned}
\begin{aligned}
E[X]=\frac{p^{2}+p+1}{p^{3}}
\end{aligned}
が導けます.もし,$p=1/2$であれば$E[X]=14$となります.E[X]=\frac{p^{2}+p+1}{p^{3}}
\end{aligned}
UUDの期待値
UUDの期待値を求めます.\begin{aligned}
E[X]
&=E[X| UUD]\cdot P(UUD) \\
& \quad + E[X| UUU]\cdot P(UUU) \\
& \quad + E[X| UD*]\cdot P(UD*) \\
& \quad + E[X| D**]\cdot P(D**) \\
&=3p^{2}(1-p) \\
&\quad + E[X| UUU]\cdot p^{3} \\
&\quad + (2 + E[X])p (1-p) \\
&\quad + (1 + E[X])(1-p)
\end{aligned}
E[X]
&=E[X| UUD]\cdot P(UUD) \\
& \quad + E[X| UUU]\cdot P(UUU) \\
& \quad + E[X| UD*]\cdot P(UD*) \\
& \quad + E[X| D**]\cdot P(D**) \\
&=3p^{2}(1-p) \\
&\quad + E[X| UUU]\cdot p^{3} \\
&\quad + (2 + E[X])p (1-p) \\
&\quad + (1 + E[X])(1-p)
\end{aligned}
ここで,$E[X| UUU]$は,他と違って初期状態にリセットされないので$E[X]$を用いて表すことができません.そこで,「条件付き期待値の性質」の式$E[X|A]=\sum_{i} E[X| A\cap B_{i}] P(B_{i}|A)$を使ってこの値を求めます.つまり,もう1ステップ進めれば
\begin{aligned}
&E[X| UUU] \\
&=E[X| UUUU] \cdot P(UUUU|UUU) \\
&\qquad +E[X| UUUD] \cdot P(UUUD|UUU) \\
&=(1+E[X| UUU]) p + 4(1-p)
\end{aligned}
なので,&E[X| UUU] \\
&=E[X| UUUU] \cdot P(UUUU|UUU) \\
&\qquad +E[X| UUUD] \cdot P(UUUD|UUU) \\
&=(1+E[X| UUU]) p + 4(1-p)
\end{aligned}
\begin{aligned}
E[X| UUU]
= \frac{4-3p}{1-p}
\end{aligned}
であることがわかります.E[X| UUU]
= \frac{4-3p}{1-p}
\end{aligned}
これを上式に代入して計算すると,
\begin{aligned}
E[X] = \frac{1}{p^{2}(1-p)}
\end{aligned}
となります.特に,$p=1/2$の場合には$E[X]=8$です.E[X] = \frac{1}{p^{2}(1-p)}
\end{aligned}
UDUの期待値
UDUの期待値を求めます.\begin{aligned}
E[X]
&=E[X| UDU]\cdot P(UDU) \\
& \quad + E[X| UDD]\cdot P(UDD) \\
& \quad + E[X| UU*]\cdot P(UU*) \\
& \quad + E[X| D**]\cdot P(D**) \\
&=3p^{2}(1-p) \\
&\quad + (3 + E[X])p(1-p)^{2} \\
&\quad + E[X| UU*]\cdot p^{2} \\
&\quad + (1 + E[X])(1-p)
\end{aligned}
E[X]
&=E[X| UDU]\cdot P(UDU) \\
& \quad + E[X| UDD]\cdot P(UDD) \\
& \quad + E[X| UU*]\cdot P(UU*) \\
& \quad + E[X| D**]\cdot P(D**) \\
&=3p^{2}(1-p) \\
&\quad + (3 + E[X])p(1-p)^{2} \\
&\quad + E[X| UU*]\cdot p^{2} \\
&\quad + (1 + E[X])(1-p)
\end{aligned}
今度は$E[X| UU*]$が初期化されないので,別途求めます.前と同様に
\begin{aligned}
&E[X| UU*] \\
&=E[X|UUU]P(UUU|UU) \\
&\qquad + E[X|UUDU]P(UUDU|UU) \\
&\qquad + E[X|UUDD]P(UUDD|UU) \\
&=(1+E[X| UU*])p \\
&\qquad + 4p(1-p) \\
&\qquad + (4+E[X])(1-p)^{2}
\end{aligned}
より,&E[X| UU*] \\
&=E[X|UUU]P(UUU|UU) \\
&\qquad + E[X|UUDU]P(UUDU|UU) \\
&\qquad + E[X|UUDD]P(UUDD|UU) \\
&=(1+E[X| UU*])p \\
&\qquad + 4p(1-p) \\
&\qquad + (4+E[X])(1-p)^{2}
\end{aligned}
\begin{aligned}
E[X| UU*]
&=\frac{4-3p}{1-p} + E[X](1-p)
\end{aligned}
となります.E[X| UU*]
&=\frac{4-3p}{1-p} + E[X](1-p)
\end{aligned}
これを上式に代入して$E[X]$を求めると
\begin{aligned}
E[X]
&=\frac{p(1-p)+1}{p^{2}(1-p)}
\end{aligned}
となります.特に,$p=1/2$の場合には$E[X]=10$です.E[X]
&=\frac{p(1-p)+1}{p^{2}(1-p)}
\end{aligned}
DUUの期待値
DUUの期待値を求めます.\begin{aligned}
E[X]
&=E[X| DUU]\cdot P(DUU) \\
& \quad + E[X| DUD]\cdot P(DUD) \\
& \quad + E[X| DD*]\cdot P(DD*) \\
& \quad + E[X| U**]\cdot P(U**) \\
&=3p^{2}(1-p) \\
&\quad + E[X| DUD] \cdot p (1-p)^{2}\\
&\quad + E[X| DD*]\cdot (1-p)^{2} \\
&\quad + (1 + E[X])p
\end{aligned}
E[X]
&=E[X| DUU]\cdot P(DUU) \\
& \quad + E[X| DUD]\cdot P(DUD) \\
& \quad + E[X| DD*]\cdot P(DD*) \\
& \quad + E[X| U**]\cdot P(U**) \\
&=3p^{2}(1-p) \\
&\quad + E[X| DUD] \cdot p (1-p)^{2}\\
&\quad + E[X| DD*]\cdot (1-p)^{2} \\
&\quad + (1 + E[X])p
\end{aligned}
ここで,
\begin{aligned}
&E[X| DUD] \\
&=E[X| DUDUU] \cdot P(DUDUU|DUD) \\
&\quad + E[X| DUDUD] \cdot P(DUDUD|DUD) \\
&\quad + E[X| DUDD] \cdot P(DUDD|DUD) \\
&=5p^{2} \\
&\quad + (2 + E[X| DUD])p(1-p) \\
&\quad + (2 + E[X|DD*]) (1-p)
\end{aligned}
より&E[X| DUD] \\
&=E[X| DUDUU] \cdot P(DUDUU|DUD) \\
&\quad + E[X| DUDUD] \cdot P(DUDUD|DUD) \\
&\quad + E[X| DUDD] \cdot P(DUDD|DUD) \\
&=5p^{2} \\
&\quad + (2 + E[X| DUD])p(1-p) \\
&\quad + (2 + E[X|DD*]) (1-p)
\end{aligned}
\begin{aligned}
[1 - p(1-p)]E[X| DUD] - (1-p)E[X| DD*] &\\
=3p^{2} + 2 &
\end{aligned}
さらに,[1 - p(1-p)]E[X| DUD] - (1-p)E[X| DD*] &\\
=3p^{2} + 2 &
\end{aligned}
\begin{aligned}
&E[X| DD*] \\
&=E[X| DDUU]\cdot P(DDUU|DD) \\
&\quad + E[X| DDUD]\cdot P(DDUD|DD) \\
&\quad + E[X| DDD]\cdot P(DDD|DD) \\
&=4p^{2} \\
&\quad + (1 + E[X|DUD])p(1-p) \\
&\quad + (1 + E[X| DD*])(1-p)
\end{aligned}
より&E[X| DD*] \\
&=E[X| DDUU]\cdot P(DDUU|DD) \\
&\quad + E[X| DDUD]\cdot P(DDUD|DD) \\
&\quad + E[X| DDD]\cdot P(DDD|DD) \\
&=4p^{2} \\
&\quad + (1 + E[X|DUD])p(1-p) \\
&\quad + (1 + E[X| DD*])(1-p)
\end{aligned}
\begin{aligned}
-p(1-p)E[X|DUD] + pE[X| DD*] & \\
=3p^{2}+1 &
\end{aligned}
となります.連立方程式を解くと-p(1-p)E[X|DUD] + pE[X| DD*] & \\
=3p^{2}+1 &
\end{aligned}
\begin{aligned}
E[X|DUD] &= \frac{3p^{2}+p+1}{p^{2}} \\
E[X| DD*] &= \frac{2p^{2}+p+1}{p^{2}}
\end{aligned}
が得られます.E[X|DUD] &= \frac{3p^{2}+p+1}{p^{2}} \\
E[X| DD*] &= \frac{2p^{2}+p+1}{p^{2}}
\end{aligned}
これを上式に代入すると,
\begin{aligned}
E[X] = \frac{1}{p^{2}(1-p)}
\end{aligned}
となります.特に,$p=1/2$の場合には$E[X]=8$です.E[X] = \frac{1}{p^{2}(1-p)}
\end{aligned}
参考文献/記事
- 期待値と条件付確率 - math314のブログ:とても参考になります.最初,確率漸化式で計算しようとしたのですが,あまりの面倒臭さから他の方法を探す中で辿り着きました.この記事で,条件付き期待値の有効性を知りました.2017年にEvernoteのクリップしたまま忘れていたのですが,今回引っ張り出して参考にしました.
確率漸化式で解こうとすると,とんでもなく面倒くさいことになります(詳しくは参考記事を見てください).気が向いたら,計算を記事にするかもしれません(放置するパターン...).
➡考えてくれた方がいました!:スリーヒットダイス|朱理
