幾何分布
幾何分布
確率変数 $X$ が $X=k$ と観測される確率 $\mathrm{Pr}(X=k)$ が
であるとき、
$X$ が
幾何分布に従うという。
具体例: サイコロの出目
サイコロを何度も振り、$1$ の目が出るまでの回数を $X$ とする。
このとき、$X=k$ となる確率 $\mathrm{Pr}(X=k)$ は $p=\frac{1}{6}$ の幾何分布に従う。
すなわち、
である。
解説
サイコロの各目が出る確率を $\frac{1}{6}$ とする。
$1$ の目が出る確率 $p$ は
である。一方、$1$ でない目 $(2,3,4,5,6)$ が出る確率は
である。
である。
$1$ の目が出るまでサイコロを何度も振り続けるとし、
最初の $k-1$ 回 は $1$ でない目 $(2,3,4,5,6)$ が出てしまい、
$k$ 回目でようやく $1$ の目が出たとする。
このとき、(各試行が独立であるとすると)
$k$ 回目で $1$ の目が出る確率は、
である。
これは $p=\frac{1}{6}$ の場合の幾何分布に等しい。
期待値
幾何分布に従う確率変数 $X$ の期待値 $E(X)$ は、
である。
証明
確率分布が
幾何分布に従うので、
$X$ の期待値は、
$$
\tag{1}
$$
である。
右辺の総和を求めるために、関数 $1/(1-x)$ のテーラー展開
に着目すると、
左辺の微分は、
であり、
右辺の微分は、
であるので、
が成り立つことが分かる。
この等式を
$x= 1-p$ と変数変換して表すと、
となる。
これを$(1)$ に代入すると、
を得る。
具体例
下のグラフは、$p=\frac{1}{2}$ (
緑色)、
$p=\frac{1}{4}$ (
青色)、
$p=\frac{1}{8}$ (
ピンク色)の場合の幾何分布である。
期待値は、
である。
$p$ が小さいほど、グラフが平坦になり、期待値が増加する。
分散と標準偏差
幾何分布に従う確率変数 $X$ の分散 $V(X)$ と標準偏差 $\sigma(X)$ は、
である。
証明
一般に
分散は二乗期待値と期待値の二乗の差に等しい。
すなわち、
が成り立つ。
幾何分布の期待値は、
$
E(X) = \frac{1}{p}
$
であるので、
\begin{eqnarray}
V(X) &=& E(X^2) - \frac{1}{p^2}
\end{eqnarray}
$$
\tag{1}
$$
である。
よって、
二乗期待値 $E(X^2)$ を求めれば、
分散 $V(X)$ が求まる。
確率変数 $X$ が
幾何分布に従うので、
二乗期待値 $E(X^2)$ は、
\begin{eqnarray}
E(X^2) &=& \sum_{k=1}^{\infty} k^2 \hspace{0.5mm} \mathrm{Pr}(X=k)
\\
&=& \sum_{k=1}^{\infty} k^2 \hspace{0.5mm} p(1-p)^{k-1}
\\
&=& p \sum_{k=1}^{\infty} k^2 \hspace{0.5mm} (1-p)^{k-1}
\end{eqnarray}
$$
\tag{2}
$$
である。
右辺の総和を求めるために、関数 $1/(1-x)$ のテーラー展開
に着目し、両辺を微分すると、
であり、
両辺に $x$ を掛けて、
とし、
再び両辺を微分すると、
である。
ここで
$x=1-p$ とすると、
であるので、
$(2)$ に代入すると、
である。
従って、
$(1)$ から
を得る。
これより、標準偏差 $\sigma(X)$ は
\begin{eqnarray}
\sigma(X) &=& \sqrt{V(X)}
\\
&=& \sqrt{\frac{1-p}{p^2} }
\end{eqnarray}
具体例 :
下のグラフは、$p=\frac{1}{2}$ (
緑色)、
$p=\frac{1}{4}$ (
青色)、
$p=\frac{1}{8}$ (
ピンク色)の場合の幾何分布である。
分散は、
\begin{eqnarray}
V(X)
= \left\{
\begin{array}{cc}
2 & (p=\frac{1}{2})
\\
12 & (p=\frac{1}{4})
\\
56 & (p=\frac{1}{8})
\end{array}
\right.
\end{eqnarray}
である。
$p$ が小さいほど、グラフが平坦になり、分散が増加する。
負の二項分布との関係
幾何分布は
負の二項分布の特別な場合である。
言い換えると、
負の二項分布は幾何分布を一般化した分布である。
解説
負の二項分布
\begin{eqnarray}
\mathrm{Pr}(X=k)
&=& \left(
\begin{array}{c}
k+r-1
\\
k
\end{array}
\right)
p^{r} (1-p)^{k}
\\
\\
&& (k=0,1,2,\cdots)
\end{eqnarray}
と
幾何分布
\begin{eqnarray}
\mathrm{Pr}(X=k) &=& p(1-p)^{k}
\\
\\
&& (k=0,1,2,\cdots)
\end{eqnarray}
を比較すると明らかなように、
負の二項分布の $r=1$ の場合が幾何分布である。
負の二項分布は、成功と失敗のあるテストを行って、
そのテストが「$r$ 回成功するまでに $k$ 回失敗する確率」を表している
(
具体例を参考)。
したがって、
幾何分布は、
成功と失敗のあるテストを行って、
そのテストが「$1$ 回成功するまでに $k$ 回失敗する確率」を表している。
言い換えると、
「成功するまでに何回失敗するのか」を表すと解釈できる。