POINT
- 条件付き期待値とは,「ある事象が起きたという条件のもとでの期待値」のことです.
- 計算を事象ごとに分割することで,複雑な期待値の問題を簡単に解けます.
この記事では,「条件付き期待値とは何か?」を直感的に理解できるように具体例を使って丁寧に解説します.
高校数学から少し踏み込んだ内容ですが,確率・統計の学習だけでなく,AtCoderなどの競技プログラミングでもよく使われる考え方ですので,ぜひ習得しましょう.
条件付き期待値の基本的な考え方は,条件付き期待値とは?具体例で丁寧に解説をご覧ください.
- 条件付き期待値とは?
- 条件付き期待値を使うメリット
- 応用例1 | 2つのサイコロの出た目の積
- 応用例2 | 成功するまでの試行回数の期待値
- 応用例3 | 賭ケグルイ双(スリーヒットダイス)
- 応用例4 | 競技プログラミング
- 参考文献
条件付き期待値とは?
条件付き期待値とは,「特定の事象が起きたという前提の下での期待値」のことです.条件付き確率に似た概念です.例えば,サイコロを2回投げて「出た目の積」を考えます.
このとき,「1回目に2が出た」という条件の下での期待値は,次のように計算できます:
\begin{aligned}
& (2\times 1) \times \frac{1}{6} + (2\times 2) \times \frac{1}{6} + \cdots + (2\times 6) \times \frac{1}{6}
\end{aligned}
& (2\times 1) \times \frac{1}{6} + (2\times 2) \times \frac{1}{6} + \cdots + (2\times 6) \times \frac{1}{6}
\end{aligned}
このように,特定の条件が与えられた上での期待値が「条件付き期待値」です.
条件付き期待値を使うメリット
条件付き期待値には,重要な公式があります:\begin{aligned}
(\text{期待値})
&=\sum_{A} (\overbrace{\text{事象$A$が起きた上での期待値}}^{\text{条件付き期待値}} ) \\
&\qquad\qquad \times (\text{事象$A$が起きる確率})
\end{aligned}
(\text{期待値})
&=\sum_{A} (\overbrace{\text{事象$A$が起きた上での期待値}}^{\text{条件付き期待値}} ) \\
&\qquad\qquad \times (\text{事象$A$が起きる確率})
\end{aligned}
この「事象$A$が起きた上での期待値」を,条件付き期待値と言います.
条件付き期待値を使うと,複雑な問題を簡単に計算できることがあります.
応用例1 | 2つのサイコロの出た目の積
具体例を見てみましょう(参考:Wikipedia)サイコロを2回振り,「出た目の積」の期待値を求めます.
$i$の目が出る確率を$P(\{i\})$として,期待値の定義から直接計算すると,
\begin{aligned}
E
&= \sum_{i,j=1}^{6} (i\cdot j) \cdot P(\{i\})P(\{j\})
\end{aligned}
で,これは $6\times 6=36$ 通りすべてを計算する必要があり,大変です.E
&= \sum_{i,j=1}^{6} (i\cdot j) \cdot P(\{i\})P(\{j\})
\end{aligned}
しかし,条件付き期待値を使えば,
\begin{aligned}
\text{(期待値)}
& = \sum_{i=1}^{6}
\text{(1回目に$i$が出たときの条件付き期待値)} \\
&\qquad\qquad
\times \text{(1回目に$i$が出る確率)}
\end{aligned}
となります.$36$個の和が$6$個に減り,計算量が大幅に減ります.\text{(期待値)}
& = \sum_{i=1}^{6}
\text{(1回目に$i$が出たときの条件付き期待値)} \\
&\qquad\qquad
\times \text{(1回目に$i$が出る確率)}
\end{aligned}
この式を具体的に書き下すと
\begin{aligned}
E
&= \sum_{i=1}^{6} \biggl[\sum_{j=1}^{6} ij P(\{j\}) \biggr] P(\{i\})
\end{aligned}
となります.この式は,最初の期待値の定義式を変形したものになっていることがわかります.E
&= \sum_{i=1}^{6} \biggl[\sum_{j=1}^{6} ij P(\{j\}) \biggr] P(\{i\})
\end{aligned}
全ての目が$1/6$の確率で出るとき,条件付き期待値の部分は
\begin{aligned}
\sum_{j=1}^{6} ij P(\{j\})
&=\sum_{j=1}^{6} ij \frac{1}{6} \\
&=\frac{i}{6} \cdot \frac{6\cdot 7}{2} \\
&=\frac{7}{2} i
\end{aligned}
と計算できます.\sum_{j=1}^{6} ij P(\{j\})
&=\sum_{j=1}^{6} ij \frac{1}{6} \\
&=\frac{i}{6} \cdot \frac{6\cdot 7}{2} \\
&=\frac{7}{2} i
\end{aligned}
したがって,期待値は
\begin{aligned}
E
&= \sum_{i=1}^{6} \frac{7}{2} i \cdot \frac{1}{6} \\
&=\frac{7}{2} \cdot \frac{6\cdot 7}{2} \cdot \frac{1}{6} \\
&=\frac{49}{4}
\end{aligned}
となります.E
&= \sum_{i=1}^{6} \frac{7}{2} i \cdot \frac{1}{6} \\
&=\frac{7}{2} \cdot \frac{6\cdot 7}{2} \cdot \frac{1}{6} \\
&=\frac{49}{4}
\end{aligned}
この例では,条件付き期待値を使うことで,36通りの数え上げをせずに済みました.
応用例2 | 成功するまでの試行回数の期待値
次の記事で詳しく扱っています.➡成功するまでの試行回数の期待値
事象が起こるまでの試行回数
確率$0 < p < 1$で成功する試行を成功するまで繰り返し,成功した時点で終了する.このとき,終了するまでの試行回数の期待値は$1/p$である.
【略解】\begin{aligned}
E[X]
&=E[X| \text{1回目に成功}]\cdot P(\text{1回目に成功}) \\
& \quad + E[X| \text{1回目に失敗}]\cdot P(\text{1回目に失敗}) \\
&=1\cdot p + (1 + E[X])\cdot (1-p) \\
&=1+(1-p)E[X]
\end{aligned}
です.これを$E[X]$について解けばE[X]
&=E[X| \text{1回目に成功}]\cdot P(\text{1回目に成功}) \\
& \quad + E[X| \text{1回目に失敗}]\cdot P(\text{1回目に失敗}) \\
&=1\cdot p + (1 + E[X])\cdot (1-p) \\
&=1+(1-p)E[X]
\end{aligned}
\begin{aligned}
E[X] = 1/p
\end{aligned}
が得られます.//E[X] = 1/p
\end{aligned}
応用例3 | 賭ケグルイ双(スリーヒットダイス)
マンガ『賭ケグルイ双』のゲーム『スリーヒットダイス』の解析にも使えます.➡スリーヒットダイスの期待値の計算例
応用例4 | 競技プログラミング
AtCoderなどの競技プログラミングでも条件付き期待値を使った問題が出題されます.EDPC | J - Sushi
J - Sushi問題概要:
- $1 \sim N$の皿があり,皿$i$には寿司が$a_{i}$個乗っている.
- 各ステップでランダムに皿を1枚選び,寿司を1つ食べる(空の皿が選ばれた場合は何もしない)
- 全ての寿司を食べ終わるまでの回数の期待値を求めよ.
条件付き期待値を用いた解法:
寿司が1個の皿,2個の皿,3個の皿の枚数をそれぞれ$i$枚,$j$枚,$k$枚とする.
- $\mathrm{dp}[i][j][k] = (i, j, k)\text{からスタートしたときの期待値}$
- $P_{x} = x\text{枚の皿が選ばれる確率}$
\begin{aligned}
\mathrm{dp}[i][j][k]
& = 1 \\
&\quad + \mathrm{dp}[i][j][k] \cdot P_{0} \\
&\quad + \mathrm{dp}[i-1][j][k] \cdot P_{1} \\
&\quad + \mathrm{dp}[i][j-1][k] \cdot P_{2} \\
&\quad + \mathrm{dp}[i][j][k-1] \cdot P_{3} \\
\end{aligned}
と計算できる.\mathrm{dp}[i][j][k]
& = 1 \\
&\quad + \mathrm{dp}[i][j][k] \cdot P_{0} \\
&\quad + \mathrm{dp}[i-1][j][k] \cdot P_{1} \\
&\quad + \mathrm{dp}[i][j-1][k] \cdot P_{2} \\
&\quad + \mathrm{dp}[i][j][k-1] \cdot P_{3} \\
\end{aligned}