チェビシェフの不等式とは?

データに対するチェビシェフの不等式
  総数 $n$ のデータ $\{x_{1}, x_{2},\cdots,x_{n}\}$ の平均と標準偏差をそれぞれ $\overline{x}$, $s$ とする。 このとき、
を満たすデータの数は、
より少ない。ここで $\lambda$ は $\lambda>1$ を満たす任意の数とする。 この関係をチェビシェフの不等式 (Chebyshev inequality) と呼ぶ
定性的な説明
  下のグラフはサンプル数 $n=2000$ のデータのヒストグラムであり、 平均と標準偏差はそれぞれ
である。
また、$\overline{x} + 2s$ より大きな値のデータと $\overline{x} - 2s$ より小さな値のデータ (図の矢印の領域に含まれるデータ)が全部で $89$ 個であるという。 すなわち、
$$ \tag{0} $$ を満たすデータの総数が $89$ であるという。
  この結果は $\lambda= 2$ の場合のチェビシェフの不等式を満たす。 チェビシェフの不等式に依れば、 $(0)$ を満たすデータの総数は
以下ではなくてならない。$89$ という数は不等式の範囲に収まる。
  この例から分かるように、 チェビシェフの不等式は平均から離れた両端にあるデータの総数の上限を与える。 この上限はデータの特性に依存しない、すなわち、 どのようなデータに対しても存在する。


  証明
  標準偏差の定義より、$s^2$ は、
である。 右辺を $|x_{i} - \overline{x}| > \lambda s$ を満たす項と、 $|x_{i} - \overline{x}| \leq \lambda s$ を満たす項に分けて、
$$ \tag{1} $$ と表す。 $(1)$ の右辺の一つ目の総和では、全ての項で $|x_{i} - \overline{x}| > \lambda s$ が満たされるので、
も満たされる。 ゆえに
$$ \tag{2} $$ が成り立つ。 また、$(1)$ の右辺の二つ目の総和では、 各項が正であることから、
$$ \tag{3} $$ が成り立つ。 以上の $(1) (2) (3)$ から
が成り立つ。 $\lambda^2 s^2$ は正の定数であるので、この数で両辺を割ると、
を得る。 右辺は $|x_{i} - \overline{x}| > \lambda s$ を満たすデータの総数を表すので、 次の結論を得る。すなわち、

「 $ |x_{i}-\overline{x} | > \lambda s $ を満たすデータの総数は、$\frac{n}{\lambda^2}$ より少ない。」

補足
  $\lambda = 3$ の場合、チェビシェフの不等式は、

「 $ |x_{i}-\overline{x} | > 3 s $ を満たすデータの総数は、$\frac{n}{9}$ より少ない。」

と言い表される。
  これは、平均値 $\overline{x}$ から標準偏差の 3 倍よりも離れたデータの総数が、 全体の $1/9$ よりも少ないことを意味する。
確率論におけるチェビシェフの不等式
  確率変数 $X$ の期待値と分散をそれぞれ $E(X)$ と $V(X)$ と表し、 $\lambda$ を $1$ より大きな任意の数とする。 このとき、確率変数と期待値との差の絶対値
が標準偏差の $\lambda$ 倍
以上の大きな値として観測される確率
は $1/\lambda^{2} $ 以下である。すなわち、
が成り立つ。 これをチェビシェフの不等式 (Chebyshev inequality)という。
証明
 
連続分布の場合
  確率密度関数 (確率分布) を $f(x)$ とするとき、 分散 $V(X)$ は
である。 積分範囲を次の三つの区間
に分けて表すと、
$$ \tag{1} $$ である。一つ目の積分の積分区間では、
であることから、
が成り立つ。これより、
$$ \tag{2} $$ を得る。 同じように $(1)$ の三つ目の積分の積分区間では、
であることから、
が成り立つ。これより、
$$ \tag{3} $$ を得る。以上の $(1)$ $(2)$ $(3)$ より、
が成り立つ。 加えて、右辺の一つ目の積分は被積分関数が $0$ 以上であるので、
である。 したがって、
が成り立つことが分かる。 また、 $\lambda^2 V(X) > 0$ であるので、 両辺を $\lambda^2 V(X)$ で割ると、
となる。 確率密度関数 $f(x)$ の定義より、 左辺は確率変数 $X$ が
の区間に観測される確率である。すなわち、
である。以上から、
を得る。