「分散 = 二乗平均 - 平均の二乗」の証明

目次
- 証明
分散 = 二乗平均 - 平均の二乗
  データの分散 $\sigma^{2}$ と 平均 $\overline{x}$ 、および二乗平均 $\overline{x^2}$ の間には次の関係がある。 すなわち、 \begin{eqnarray} \sigma^{2} = \overline{x^2} - (\overline{x})^2 \end{eqnarray} が成立する。
証明
  総数 $n$ のデータ $\{x_{1}, x_{2},\cdots,x_{n}\} $ に対して、 平均 $\overline{x}$、二乗平均 $\overline{x^2}$、分散 $\sigma^2$ はそれぞれ \begin{eqnarray} \overline{x} &=& \frac{1}{n} \sum_{i=1}^{n} x_{i} \\ \overline{x^2} &=& \frac{1}{n} \sum_{i=1}^{n} x_{i}^2 \\ \sigma^{2} &=& \frac{1}{n} \sum_{i=1}^{n} (x_{i}- \overline{x})^2 \\ \tag{1} \end{eqnarray} と定義される。 分散を展開すると、 \begin{eqnarray} \sigma^{2} &=& \frac{1}{n} \sum_{i=1}^{n} (x_{i}- \overline{x})^2 \\ &=& \frac{1}{n} \sum_{i=1}^{n} (x_{i}^2 - 2\overline{x}x_{i} + (\overline{x})^2) \\ &=& \frac{1}{n} \sum_{i=1}^{n}x_{i}^2 - \frac{1}{n} \sum_{i=1}^{n}2\overline{x}x_{i} \\ &&+ \frac{1}{n} \sum_{i=1}^{n}(\overline{x})^2 \end{eqnarray} である。
  $(1)$ より、 右辺の第一項は、二乗平均の定義そのものであるので、 \begin{eqnarray} \sigma^{2} &=& \overline{x^2} - \frac{1}{n} \sum_{i=1}^{n}2\overline{x}x_{i} + \frac{1}{n} \sum_{i=1}^{n}(\overline{x})^2 \end{eqnarray} と表される。
  また、 第二項は、平均の定義 $(1)$ から \begin{eqnarray} - \frac{1}{n} \sum_{i=1}^{n} 2\overline{x}x_{i} &=& - 2\overline{x}\frac{1}{n} \sum_{i=1}^{n} x_{i} \\ &=& - 2(\overline{x})^2 \end{eqnarray} であるので、 \begin{eqnarray} \sigma^{2} &=& \overline{x^2} - 2(\overline{x})^2 + \frac{1}{n} \sum_{i=1}^{n}(\overline{x})^2 \tag{2} \end{eqnarray} が成立する。
  ここで、 $$\sum_{i=1}^{n} 1 = n$$ に注意すると、 $(2)$ の第三項が \begin{eqnarray} \frac{1}{n} \sum_{i=1}^{n}(\overline{x})^2 &=& \frac{1}{n}(\overline{x})^2 \sum_{i=1}^{n}1 \\ &=& (\overline{x})^2 \end{eqnarray} と表せることから、 \begin{eqnarray} \sigma^{2} &=& \overline{x^2}- 2(\overline{x})^2 + (\overline{x})^2 \\ &=& \overline{x^2}- (\overline{x})^2 \end{eqnarray} が成り立つことが分かる。