【ベイズの定理】条件付き確率はベン図でわかる

POINT
  • ベン図を使えば,条件付き確率・ベイズの定理が簡単に理解できる.
  • ベイズの定理の応用例を紹介.
  • 結論:下図より,$A$が起こったときに$B$が起こる確率は$\displaystyle P(B|A)=\frac{P(A\cap B)}{P(A)}=\frac{P(B)P(A|B)}{P(A)}$となることがわかる!
    f:id:IsThisAPen:20181027172550j:plain:w300
    ベイズの定理

わかりにくい条件付き確率・ベイズの定理も,ベン図を使えば直感的に理解することができます!
とにかく簡単な例から学びたいという方は,次の記事を参照してください:
www.mynote-jp.com

確率とベン図

2つの事象A, Bを考えましょう.これらの事象としては,例えば以下が考えられます:

事象A 事象B
サイコロで偶数が出る サイコロで6が出る
40℃以上の熱がある インフルエンザである
金髪である 外国人である
信号が青である (自分が)信号が青であることを認識している


これらの事象の包含関係は,以下のベン図で表すことができます.つまり,事象A, Bには

  • Aが起こり,Bは起きない
  • Aは起こらないが,Bは起こる
  • AもBも起こる
  • AもBも起こらない

という4通りの場合が考えられます.

f:id:IsThisAPen:20180624140221j:plain:w300
事象Aと事象Bを表すベン図 ($\Omega$は全事象を表す).

以下では,各事象のベン図に占める面積が,確率と等しくなるように描かれていることにしましょう.つまり,事象$A$の起こる確率$P(A)$はベン図における面積で表されます.

条件付き確率とベン図

事象$A$が起こったとことがわかったとき,確率を表すベン図は図のように変化します.このとき,確率はもはや$P$では表すことができません.なぜなら,全事象が$A$となるため新しい(確率測度)$\tilde{P}$は
\begin{align}
\tilde{P}(A)=1,\quad \tilde{P}(A^c)=0
\end{align}
を満たすはずですが,$P$は(一般に)この性質をもたないからです.
f:id:IsThisAPen:20180625204855j:plain:w400
事象Aが起こったときのベン図 ($A$が全事象になる).

確率はベン図の面積比ですから,$P$と$\tilde{P}$には次の関係が成り立つことがわかります(*1):
\begin{align}
\tilde{P}(B)=\frac{P(A\cap B)}{P(A)}.
\end{align}

通常,$\tilde{P}(B)$を$P(B|A)$で表します.以降,この記法を用いることにします.

ここで,注意すべきは

一般には,$P(B|A)$と$P(A|B)$は等しくない

ということです.つまり,事象Aと事象Bのどちらが起こったのかにより,$A\cap B$の起こる確率は異なります.これは,以下のベン図のように,$P(A)$に対する$P(A\cap B)$の面積比と,$P(B)$に対する$P(A\cap B)$の面積比が異なることを意味します:

f:id:IsThisAPen:20180624141122j:plain:w400
事象AとBどちらが起こるかによって確率は異なる.


理解を深めるために,上で見た事象$A$, $B$の例を使って具体的に考えてみましょう:

$P(B|A)$ $P(A|B)$
サイコロで偶数が出たときに,その目が6である確率 ($=1/3$) $\neq$ サイコロで6が出たときに,その目が偶数である確率 ($=1$)
40℃以上の熱があったときに,インフルエンザである確率. $\neq$ インフルエンザのときに,40℃以上の熱が出る確率.
金髪である人が,外国人である確率. $\neq$ 外国人が金髪である確率.
信号が青であるときに,(自分が)信号が青であると思っている確率. $\neq$ (自分が)信号が青であると思っているときに,信号が青である確率.

ベイズの定理

上のベン図から,$P(B|A)$と$P(A|B)$はそれぞれ$P(A)$と$P(B)$の大きさから決まることがわかります.実際,上の2式から$P(A\cap B)$を消去すれば,次の関係式が導かれます.この関係式は,ベイズの定理と呼ばれます:

ベイズの定理
\begin{align} P(B|A)=\frac{P(B)P(A|B)}{P(A)} \end{align}


ベイズの定理を使うと,$P(A|B)$の情報から$P(B|A)$を計算することができます.具体的な例を見てみましょう.

【例】病気の診断

ベイズの定理は「病気の診断」に応用できます.なぜなら,病気$D$と症状$S$を考えたとき,

  • $P(S|D)$:病気$D$のときに,症状$S$が現れる確率

をデータとして蓄積し,

  • $P(D|S)$:症状$S$が現れたときに病気$D$である確率

を求めることが「病気の診断」であるからです.そして,これはベイズの定理を用いて
\begin{align}
P(D|S)=\frac{P(D)P(S|D)}{P(S)}
\end{align}
と求めることができます.


特に,病気が$(D_1,...,D_n)$のいずれかであることがわかっている場合は
\begin{align}
P(S)
&=\sum_{j=1}^n P(S \cap D_j) \\
&=\sum_{j=1}^n P(D_j)P(S|D_j)
\end{align}
であることから
\begin{align}
P(D_i|S)=\frac{P(D_i)P(S|D_i)}{\sum_j P(D_j)P(S|D_j)}
\end{align}
と計算することができます.

【例】人間の直感とベイズの定理

ダニエル・カーネマン「ファスト&スロー」第16章で扱われている例を紹介します.以下の2つの問を考えてみましょう.

夜,市内1台のタクシーがひき逃げをした.以下の情報のもとで,青タクシーがひき逃げをした確率は?
  • 目撃者は,タクシーが青だったと証言している.
  • 目撃者がタクシーの色を正しく判別できる確率は80%.
但し,市内に走るタクシーの条件だけを変えた問1と問2を考える:
問1
  • 市内に走るタクシーは,85%が緑のタクシー,15%が青のタクシーである.
  • タクシーの色とひき逃げのしやすさは無関係である.
問2
  • 市内に走るタクシーは,50%が緑のタクシー,50%が青のタクシーである.
  • 過去の事故の85%は緑のタクシーが関与している.


まずは,現実で上の状況に直面した場合を想像して,直感的に答えてみてください.問1と問2では,青タクシーがひき逃げをした確率はどちらが高くなるでしょうか?







実は,問1,問2のどちらも同じ確率(41%)になります.しかし,著者によると「人は因果関係を持たない情報を無視する傾向がある」そうです.これは,次の表で表すことができます:


与えられた情報人の行う推定
問1 母集団の情報 情報を無視する:80%に近い値を予想する
問2 因果関係の情報 情報を重視する:ベイズの定理から導かれる値(41%)に近い値を予想する



それでは実際にベイズの定理を用いて計算をしてみましょう.まずは,事象を以下で定めます:

事象A 事象B
目撃者が青と言う ひき逃げをしたタクシーの色が青である

このとき,求めたい確率は「目撃者がタクシーが青だったと証言したとき,青タクシーがひき逃げをした確率」です.これは,ベイズの定理を用いて計算することができます:

求めたい確率
$$P(B|A)=\frac{\color{red}{P(B)}\color{blue}{P(A|B)}}{\color{green}{P(A)}}$$

したがって,右辺の3つの確率を計算すれば良いことがわかります.


まず,問1・問2で共通の条件である

  • 「目撃者はタクシーが青だと証言」
  • 「目撃者は80%の確率でタクシーの色を正しく判別できる」

ことは,次を意味しています:
$$\color{blue}{P(A|B)=0.8},P(A|B^c)=0.2.$$


次に,問1・問2におけるそれぞれの異なるタクシーの情報は,どちらも$$\color{red}{P(B)=0.15},P(B^c)=0.85$$を意味しています.詳しく見てみましょう:

  • 問2では,条件の文章が直接この式を意味しています.
  • 問1では,(遭遇したタクシーの色が青である確率) = (ひき逃げをしたタクシーの色が青である確率)であることを確認する必要があります.直感的に明らかなようにも思えますが,ちゃんとベイズの定理から示せます.まず,事象C,Dを以下で定めましょう:

    事象B 事象C 事象D
    ひき逃げをしたタクシーの色が青である 遭遇したタクシーの色が青である タクシーがひき逃げをする


    • タクシーの色とひき逃げのしやすさは無関係であることは,$P(D|C)=P(D|C^c)=P(D)$を意味するので,$P(B)=P(C|D)=P(C)P(D|C)/P(D)=P(C)$であることがわかります.
    • あるいは,次のようにも考えられます.タクシーの色とひき逃げのしやすさは無関係であることは,$P(C\cap D)=P(C)P(D)$を意味する(独立事象)ので,$P(B)=P(C|D)=P(C\cap D)/P(D)=P(C)$.


最後に,$P(A)$は次のように計算できます:
\begin{align}
\color{green}{P(A)}
&=P(A\cap B) + P(A\cap B^c)\\
&=P(B)P(A|B) + P(B^c)P(A|B^c)\\
&=0.29
\end{align}


以上を「求めたい確率の式」に代入すれば
\begin{align}
P(B|A)=\frac{P(B)P(A|B)}{P(A)}\simeq 0.41
\end{align}
であることがわかります.直感的には80%付近と予想する人が多いなかで,実際の確率はその半分程度なのです.

参考文献/記事

*1:$P(A)$は規格化定数というわけです

プライバシーポリシー

お問い合わせ