チェビシェフの不等式とその応用

POINT

  • チェビシェフの不等式(Chebyshev’s inequality)の導出と応用例の紹介.
  • チェビシェフの不等式から,標準偏差がバラツキの尺度となることがわかる.

チェビシェフの不等式から,「標準偏差がバラツキの尺度として用いられる」理由がわかります.



【覚え方】
分散の定義
\begin{aligned}
\sigma^{2}
&=E[(X - E[X])^{2}]
\end{aligned}
からスタートします.期待値の定義から
\begin{aligned}
\sigma^{2}
&=E[(X - E[X])^{2}] \\
&= \epsilon^{2} \cdot P( (X - E[X])^{2} = \epsilon^{2}) + \cdots \\
& \geq \epsilon^{2} \cdot P(|X - E[X]| \geq \epsilon^{2})
\end{aligned}
となり,
\begin{aligned}
P(|X - E[X]| \geq \epsilon^{2})
\leq \biggl(\frac{\sigma}{\epsilon} \biggr)^{2}.
\end{aligned}
これが基本形です.流れを覚えておけば,その都度,導出できそうですね.

導出

期待値が$\mu$,分散が$\sigma^2$の確率変数$X$と任意の$k>0$に対して,以下のChebyshevの不等式が成立します:

Chebyshevの不等式
\begin{aligned} P(|X-\mu|\geq k\sigma)\leq \frac{1}{k^2} \tag{1} % \label{eq:Chebyshev1} \end{aligned}

【導出】
$k>0$に対して

\begin{aligned}
\sigma^2
&=E(X-EX)^2\\
&\geq k^2\sigma^2\cdot P\bigl(\left\{\omega\,\bigl|\, |X-EX|> k\sigma \right\}\bigr)
\end{aligned}
が成立することから示される.//


また,上の表式は簡単な変形で以下のように書き直すことができます:

\begin{aligned}
& P(|X-\mu|\geq k\sigma)\leq \frac{1}{k^2}\\
&\qquad\Leftrightarrow P(|X-\mu|< k\sigma)\geq 1-\frac{1}{k^2}\\
\Leftrightarrow &P(|X-\mu|\geq k)\leq \frac{\sigma^2}{k^2}\\
&\qquad\Leftrightarrow P(|X-\mu|< k)\geq 1-\frac{\sigma^2}{k^2}
\end{aligned}

式の意味

式(1)からわかるように,
平均値から離れた値を取る確率は小さくなる
ことを主張しています.


そして,「平均値からの距離」と「小さくなる度合い」は

標準偏差$\sigma$の何倍かを基準に測られる
のです.

このことから,標準偏差がバラツキの尺度として用いられることが納得できますね.

応用例:コイン投げ

$n$回のコイン投げで,表の出た回数$T_n$が$(\mu-k,\mu+k)$の範囲にある確率$P(\mu-k < T_n< \mu+k)$をChebyshevの不等式を用いて評価しましょう.


Chebyshevの不等式から,$k$が$\sigma$よりも十分に大きければ,$P(\mu-k < T_n< \mu+k)$は1に近づくことがわかります.
以下で,具体的な表式を求めてみましょう.


$X_n$を

\begin{aligned}
X_n=
\begin{cases}
\,1&(n\text{回目に表})\\
\,0&(n\text{回目に裏})
\end{cases}
\end{aligned}
で定めると,$\{X_n\}$は独立確率変数列となる.

$P(X_n=1)=P(X_n=0)=1/2$より$E(X_n)=1/2, V(X_n)=1/4$なので,表の出た回数

\begin{aligned}
T_n \coloneqq X_1+\cdots +X_n
\end{aligned}
に対して平均値,分散は
\begin{aligned}
\mu=E(T_n)&=E(X_1)+\cdots +E(X_n)=\frac{n}{2}\\
\sigma^2=V(T_n)&=V(X_1)+\cdots +V(X_n)=\frac{n}{4}
\end{aligned}
となる.*1

よって標準偏差は$\sigma(T_n)=\sqrt{n}/2$であるから,Chebyshevの不等式より

\begin{aligned}
P(|X-n/2|< k)\geq 1-\frac{n}{4k^2}.
\end{aligned}

参考文献

*1:$\{X_n\}$が独立確率変数列であるため