チェビシェフの不等式とは?
データに対するチェビシェフの不等式
総数 $n$ のデータ $\{x_{1}, x_{2},\cdots,x_{n}\}$ の平均と標準偏差をそれぞれ $\overline{x}$, $s$ とする。
このとき、
を満たすデータの数は、
より少ない。ここで $\lambda$ は $\lambda>1$ を満たす任意の数とする。
この関係を
チェビシェフの不等式 (Chebyshev inequality) と呼ぶ
定性的な説明
下のグラフはサンプル数 $n=2000$ のデータのヒストグラムであり、
平均と標準偏差はそれぞれ
である。
また、$\overline{x} + 2s$ より大きな値のデータと
$\overline{x} - 2s$ より小さな値のデータ
(図の矢印の領域に含まれるデータ)が全部で $89$ 個であるという。
すなわち、
$$
\tag{0}
$$
を満たすデータの総数が $89$ であるという。
この結果は
$\lambda= 2$ の場合のチェビシェフの不等式を満たす。
チェビシェフの不等式に依れば、
$(0)$ を満たすデータの総数は
以下ではなくてならない。$89$
という数は不等式の範囲に収まる。
この例から分かるように、
チェビシェフの不等式は
平均から離れた両端にあるデータの総数の上限を与える。
この上限はデータの特性に依存しない、すなわち、
どのようなデータに対しても存在する。
証明
標準偏差の定義より、$s^2$ は、
である。
右辺を $|x_{i} - \overline{x}| > \lambda s$ を満たす項と、
$|x_{i} - \overline{x}| \leq \lambda s$ を満たす項に分けて、
$$
\tag{1}
$$
と表す。
$(1)$ の右辺の一つ目の総和では、全ての項で $|x_{i} - \overline{x}| > \lambda s$ が満たされるので、
も満たされる。
ゆえに
$$
\tag{2}
$$
が成り立つ。
また、$(1)$ の右辺の二つ目の総和では、
各項が正であることから、
$$
\tag{3}
$$
が成り立つ。
以上の $(1) (2) (3)$ から
が成り立つ。
$\lambda^2 s^2$ は正の定数であるので、この数で両辺を割ると、
を得る。
右辺は $|x_{i} - \overline{x}| > \lambda s$ を満たすデータの総数を表すので、
次の結論を得る。すなわち、
「 $
|x_{i}-\overline{x} | > \lambda s
$
を満たすデータの総数は、$\frac{n}{\lambda^2}$ より少ない。」
補足
$\lambda = 3$ の場合、チェビシェフの不等式は、
「 $
|x_{i}-\overline{x} | > 3 s
$
を満たすデータの総数は、$\frac{n}{9}$ より少ない。」
と言い表される。
これは、平均値 $\overline{x}$ から標準偏差の 3 倍よりも離れたデータの総数が、
全体の $1/9$ よりも少ないことを意味する。
確率論におけるチェビシェフの不等式
確率変数 $X$ の
期待値と分散をそれぞれ
$E(X)$ と $V(X)$ と表し、
$\lambda$ を $1$ より大きな任意の数とする。
このとき、確率変数と期待値との差の絶対値
が標準偏差の $\lambda$ 倍
以上の大きな値として観測される確率
は $1/\lambda^{2} $ 以下である。すなわち、
が成り立つ。
これを
チェビシェフの不等式 (Chebyshev inequality)という。
証明
連続分布の場合
確率密度関数 (確率分布) を
$f(x)$ とするとき、
分散 $V(X)$ は
である。
積分範囲を次の三つの区間
に分けて表すと、
$$
\tag{1}
$$
である。一つ目の積分の積分区間では、
であることから、
が成り立つ。これより、
$$
\tag{2}
$$
を得る。
同じように $(1)$
の三つ目の積分の積分区間では、
であることから、
が成り立つ。これより、
$$
\tag{3}
$$
を得る。以上の $(1)$ $(2)$ $(3)$ より、
が成り立つ。
加えて、右辺の一つ目の積分は被積分関数が $0$ 以上であるので、
である。
したがって、
が成り立つことが分かる。
また、 $\lambda^2 V(X) > 0$ であるので、
両辺を $\lambda^2 V(X)$ で割ると、
となる。
確率密度関数 $f(x)$ の定義より、
左辺は確率変数 $X$ が
の区間に観測される確率である。すなわち、
である。以上から、
を得る。