正規母集団の標本平均と標本分散は独立

  $X_{i}$ のそれぞれが同一の正規分布に従い、互いに独立であるならば、 標本平均

正規母集団から得られる標本平均と標本分散は独立00

と標本分散

正規母集団から得られる標本平均と標本分散は独立01

は、独立な確率分布に従う。
最終更新 2015年 12月17日


  証明  

  $n$ 個の確率変数 $\{X_{1}, X_{2}, \cdots, X_{n}\}$ が互いに独立であり、 同一の期待値 $\mu$ と、標準偏差 $\sigma$ を持つ正規分布に従うと仮定する。このとき、

正規母集団から得られる標本平均と標本分散は独立02

によって定義される $n$ 個の確率変数 $\{Y_{1}, Y_{2}, \cdots, Y_{n}\}$ は、いずれも期待値が $0$、 標準偏差が $1$ の正規分布に従う (証明は、標準正規分布と一般の正規分布との間の関連性を参考 )。 よって、$Y_{i}$ の確率密度関数 $q_{i}(y_{i})$ は

正規母集団から得られる標本平均と標本分散は独立03

  一般に独立な確率変数の組があるとき、それらの定数倍や定数を加えた確率変数の組もまた独立であるので、 $(1)$ によって定義される $\{Y_{1}, Y_{2}, \cdots, Y_{n}\}$ は、互いに独立である。 よって、 $\{Y_{1}, Y_{2}, \cdots, Y_{n}\}$ に対する同時確率密度関数 $Q(y_{1}, y_{2}, \cdots, y_{n})$ は、

正規母集団から得られる標本平均と標本分散は独立04

を満たす。これと $(2)$ から、

正規母集団から得られる標本平均と標本分散は独立05

である。ここで、ベクトル $\mathbf{y}$ を
正規母集団から得られる標本平均と標本分散は独立06
と定義すると、$\mathbf{y}$ 同士の内積が

正規母集団から得られる標本平均と標本分散は独立07

であるので、$(3)$ は、

正規母集団から得られる標本平均と標本分散は独立08

と表せる。
  確率変数 $\{Y_{1}, Y_{2}, \cdots, Y_{n}\}$ のとる $n$ 個の値 $\{y_{1}, y_{2}, \cdots, y_{n}\}$ の全体によって構成される $n$ 次元空間を $V_{Y}$ とし、 $V_{Y}$ 内の任意の領域を $\mathcal{D}_{Y}$ とする。 このとき、 $y_{1}, y_{2}, \cdots, y_{n}$ が $\mathcal{D}_{Y}$ 内に含まれる確率 $ \mathrm{Pr} (Y_{1}, Y_{2}, \cdots, Y_{n} \in {D}_{Y}) $ は、 確率密度関数 $Q(y_{1}, y_{2}, \cdots, y_{n})$ を領域 $\mathcal{D}_{Y}$ に渡って積分したものである。すなわち、

正規母集団から得られる標本平均と標本分散は独立09
である。
  ここで、 $n$ 個の確率変数 $\{Z_{1}, Z_{2}, \cdots, Z_{n}\}$ を

正規母集団から得られる標本平均と標本分散は独立10

によって定義する。行列 $A$ は、第一列の成分が全て $1/\sqrt{n}$ である直交行列である。すなわち、

正規母集団から得られる標本平均と標本分散は独立11

の形した直交行列である (このような行列の存在については、下の補足1を参考)。 このように定義した確率変数 $\{ Z_{1}, Z_{2}, \cdots, Z_{n}\}$ は、 互いに独立な確率変数になるが、このことを以下のように証明する。
  $\{ Z_{1}, Z_{2}, \cdots, Z_{n}\}$ は、$(6)$ を通じて、$\{ Y_{1}, Y_{2}, \cdots, Y_{n}\}$ から一意に定まり、互いに一対一の関係を持つので、 $\{ Z_{1}, Z_{2}, \cdots, Z_{n}\}$ のとる $n$ 個の値 $\{ z_{1}, z_{2}, \cdots, z_{n} \}$ の全体によって構成される $n$ 次元空間 $V_{Z}$ の中には、 領域 $\mathcal{D}_{Y}$ と一対一に対応する領域 $\mathcal{D}_{Z}$ があり、 $\mathcal{D}_{Y}$ 内の点と $\mathcal{D}_{Z}$ 内の点が一対一で対応する(図を参考)。
正規母集団から得られる標本平均と標本分散は独立の図0
このとき、 $\{ Z_{1}, Z_{2}, \cdots, Z_{n}\}$ の値 $\{ z_{1}, z_{2}, \cdots, z_{n}\}$ が $\mathcal{D}_{Z}$ に含まれる確率は、 $\{ Y_{1}, Y_{2}, \cdots, Y_{n}\}$ の値 $\{ y_{1}, y_{2}, \cdots, y_{n}\}$ が $\mathcal{D}_{Y}$ に含まれる確率に等しい。 すなわち、

正規母集団から得られる標本平均と標本分散は独立12

が成立する。
  右辺の確率は、 $\{ Z_{1}, Z_{2}, \cdots, Z_{n}\}$ の同時確率密度関数 $P(z_{1}, z_{2}, \cdots, z_{n}) $ を、 領域 $\mathcal{D}_{Z}$ に渡って積分したものである すなわち、

正規母集団から得られる標本平均と標本分散は独立13
である。よって、$(5)(8)(9)$ により、

正規母集団から得られる標本平均と標本分散は独立14

が成立する。また、$(4)$ により、右辺を書き換えることにより、

正規母集団から得られる標本平均と標本分散は独立15
を得る。
  右辺の積分は、領域 $\mathcal{D}_{Y}$ 上での積分であるが、 $\{ Z_{1}, Z_{2}, \cdots, Z_{n}\}$ と $\{ Y_{1}, Y_{2}, \cdots, Y_{n}\}$ が一対一の関係を持つので、 この積分を $\mathcal{D}_{Z}$ 上での積分によって表すことが可能である。 そのためには、積分変数を
正規母集団から得られる標本平均と標本分散は独立16

と変換するとよい。 この変換は、$(6)$ の逆変換になっている。 なぜなら、 $A$ が直交行列であることから、
正規母集団から得られる標本平均と標本分散は独立17

が成立し、$A^{T}$ が $A$ の逆行列であるため、 $(6)$ の逆変換が

正規母集団から得られる標本平均と標本分散は独立18

と表されるからである。
  変換 $(6)$ が、積分領域を

正規母集団から得られる標本平均と標本分散は独立19

と変換したので、その逆変換は、 積分領域を

正規母集団から得られる標本平均と標本分散は独立20

と変換する。このことから、$(10)$ の右辺は、

正規母集団から得られる標本平均と標本分散は独立21

と表される。 ここで、$J$ は、変数変換 $(11)$ に伴うヤコビアン

正規母集団から得られる標本平均と標本分散は独立22
であるが、 $(11)$ によって、

正規母集団から得られる標本平均と標本分散は独立23

である。$A$ が直交行列であることから、$A^{T}$ もまた直交行列であり。 直交行列の行列式は $\pm 1$ であるので、

正規母集団から得られる標本平均と標本分散は独立24

である。よって、$(13)$ は、

正規母集団から得られる標本平均と標本分散は独立25

である。また、$A$ が直交行列であることから、

正規母集団から得られる標本平均と標本分散は独立26

が成立するので、

正規母集団から得られる標本平均と標本分散は独立27
と表される。
  これと $(10)$ から、

正規母集団から得られる標本平均と標本分散は独立28

が成立する。
  領域 $\mathcal{D}_{Y}$ が任意の領域であることから、 領域 $\mathcal{D}_{Z}$ が任意の領域であるので、 $(14)$ の積分は、任意の積分領域に対して成立する等式である。 従って、積分範囲が

正規母集団から得られる標本平均と標本分散は独立29

と表せる領域に対しても成立する。 すなわち、

正規母集団から得られる標本平均と標本分散は独立30

が成立する。
  両辺を $b_{1}, b_{2}, \cdots, b_{n}$ によって偏微分すると、

正規母集団から得られる標本平均と標本分散は独立31

となるが、左辺を指数関数の性質から、左辺は、

正規母集団から得られる標本平均と標本分散は独立32
と表せるので、

正規母集団から得られる標本平均と標本分散は独立33

を得る。
  このように同時確率密度関数が求まったので、 それぞれの確率変数 $Z_{i}$ に対する確率密度関数 $p_{i}(z_{i})$ を求めることができる。 具体的には、 $p_{i}(z_{i})$ は、$P(z_{1}, z_{2}, \cdots, z_{n})$ を $z_{i}$ 以外の変数で積分したものである。 すなわち、

正規母集団から得られる標本平均と標本分散は独立34

である。右辺の積分は、$(15)$ から、

正規母集団から得られる標本平均と標本分散は独立35

と表せるが、ガウス積分の公式により、

正規母集団から得られる標本平均と標本分散は独立36
であるので、

正規母集団から得られる標本平均と標本分散は独立37

が成立する。従って、$(16)$ より、

正規母集団から得られる標本平均と標本分散は独立38
である。
  これが任意の $i$ に対して成立するので、$(15)$ から、

正規母集団から得られる標本平均と標本分散は独立39

が成立する。このように、 $\{ Z_{1}, Z_{2}, \cdots, Z_{n}\}$ の同時密度確率関数がそれぞれの確率変数 $Z_{i}$ の確率密度関数の積によって表されたので、 $\{ Z_{1}, Z_{2}, \cdots, Z_{n}\}$ は、互いに独立な確率変数である。
  ここで、
正規母集団から得られる標本平均と標本分散は独立40
と定義すると、$(6)$ は、

正規母集団から得られる標本平均と標本分散は独立41

と表されるが、$A$ が直交行列であること $(12)$ から、

正規母集団から得られる標本平均と標本分散は独立42

が成立する。この関係を成分で表すと、

正規母集団から得られる標本平均と標本分散は独立43
である。
  右辺は、$(1)$ から、
正規母集団から得られる標本平均と標本分散は独立45

と表せるが、下の補足2 で証明されるように、

正規母集団から得られる標本平均と標本分散は独立45
の関係が成立するので、

正規母集団から得られる標本平均と標本分散は独立46
と表せる。
  ところで、$(6) (7)(1)$ により、$Z_{1}$ は、

正規母集団から得られる標本平均と標本分散は独立47

と表せるので、$(19)$ は
正規母集団から得られる標本平均と標本分散は独立48

と表せる。これと $(17)$ により、

正規母集団から得られる標本平均と標本分散は独立49
を得る。書き換えると、
正規母集団から得られる標本平均と標本分散は独立50
である。
  $\{ Z_{1}, Z_{2}, \cdots, Z_{n}\}$ が互いに独立であるので、 $Z_{1}$ と $Z_{2}^{2} + \cdots + Z_{n}^{2}$ は、独立である。 すると、 $(21)$ から、$Z_{1}$ と $\frac{nS^{2}}{\sigma^2} $ が独立であることが分かる。 また、$Z_{1}$ は、$(20)$ と表せるので、併せて考えると、

正規母集団から得られる標本平均と標本分散は独立51

は独立であることが分かる。 これより、 $\overline{X}$ と $S^{2}$ は、独立である。すなわち、標本平均と標本分散は互いに独立である。


  補足1:   直交行列の存在

  この補足では、第一行の行ベクトルが

正規母集団から得られる標本平均と標本分散は独立A0

となっている直交行列が存在することを証明する。
  基本ベクトル $\mathbf{e}_{1}, \cdots, \mathbf{e}_{n}$ を、

正規母集団から得られる標本平均と標本分散は独立A1

と定義し、ベクトル $\mathbf{c}_{1}$ を
正規母集団から得られる標本平均と標本分散は独立A2
と定義する。
  $\mathbf{c}_{1}$ は、

正規母集団から得られる標本平均と標本分散は独立A3

であるため、既に規格化されたベクトルである。 一般に、ベクトル空間には、 任意の規格化されたベクトルを含む正規直交系が存在するので、 $ \mathbf{c}_{1}$ を含む正規直交系が存在する。それを、

正規母集団から得られる標本平均と標本分散は独立A4

と表す。これらは、正規直交系を成すので、

正規母集団から得られる標本平均と標本分散は独立A5
を満たす。
  $n$ 次正方行列 $C$ を

正規母集団から得られる標本平均と標本分散は独立A6
と定義する。 このとき、$(\mathrm{A}2)$ より、

正規母集団から得られる標本平均と標本分散は独立A7
が成立する。
  両辺の行列式を取ることにより、

正規母集団から得られる標本平均と標本分散は独立A8

を得る。 ここで、積の行列式がもとの行列の行列式の積であること ($ |AB| = |A| |B| $) と、 転置行列の行列式がもとの行列の行列式に等しいこと ($ |A^{T}| = |A| $)、および、 単位行列の行列式が $1$ であること $|I| = 1$ を使った。
  よって、
正規母集団から得られる標本平均と標本分散は独立A9

である。一般に行列式が $0$ でない行列は逆行列を持つので、 $C^{T}$ には、

正規母集団から得られる標本平均と標本分散は独立A10

を満たす行列 $(C^{T})^{-1}$ が存在する。 このことと、$(\mathrm{A}4)$ により、$C C^{T}$ には、

正規母集団から得られる標本平均と標本分散は独立A11

が成立する。
  $(\mathrm{A}4)$ と $(\mathrm{A}5)$ をまとめると、

正規母集団から得られる標本平均と標本分散は独立A12

であるので、$C$ は、直交行列である。 また、転置行列の転置行列はもとの行列に等しいことにより、$C = (C^{T})^{T}$ であるので、 $(\mathrm{A}6)$ は、

正規母集団から得られる標本平均と標本分散は独立A13

と表せるので、$C^{T}$ もまた直交行列である。
  ところで、$(\mathrm{A}1) (\mathrm{A}3)$ により、
正規母集団から得られる標本平均と標本分散は独立A14

が成立するので、 行列 $C$ の第一列の成分は、全て $ \frac{1}{\sqrt{n}} $ である。 すなわち、$C$ は、

正規母集団から得られる標本平均と標本分散は独立A15

の形をしている。よって、$C^{T}$ は、
正規母集団から得られる標本平均と標本分散は独立A16

の形をした行列である。 $(\mathrm{A}7)$ より、$C^{T}$ は直交行列であったので、次の結論を得る。 すなわち、$(\mathrm{A}8)$ のように第一行の成分が全て $\frac{1}{\sqrt{n}}$ である直交行列が存在する。

  補足2:   関係式 $(18)$ の証明

  ここでは、$(18)$ 式

正規母集団から得られる標本平均と標本分散は独立b00
を証明する。
  標本分散 $S^{2}$ の定義は、

正規母集団から得られる標本平均と標本分散は独立b01
である。ここで、$\overline{X}$ は、標本平均

正規母集団から得られる標本平均と標本分散は独立b02
である。これらより、

正規母集団から得られる標本平均と標本分散は独立b03

が成立する。 これを用いると、

正規母集団から得られる標本平均と標本分散は独立b04

が示される。






ページのトップへ戻る