超幾何分布の期待値と分散

確率解析

期待値

$$ \mathrm{E} [X] = \sum_{x=0}^n xP(X=x) $$
\(x=0\)のときは\(xP(X=x)=0\)なので
$$ = \sum_{x=1}^n xP(X=x) $$
超幾何分布の確率関数を用いると、
$$ = \sum_{x=1}^n x \frac{{}_M C_x×{}_{N-M} C_{n-x}}{{}_N C_{n}}$$
コンビネーションを階乗で書き換えると、
$$ = \sum_{x=1}^n x \frac{ \frac{M!}{(M-x)!x!} {}_{N-M} C_{n-x} }{ \frac{N!}{(N-n)!n!} } $$
\(x\)を約分して、\(\frac{nM}{N}\)を前に出すと、
$$ = \frac{nM}{N}\sum_{x=1}^n \frac{ \frac{(M-1)!}{(M-x)!(x-1)!} {}_{N-M} C_{n-x} }{ \frac{(N-1)!}{(N-n)!(n-1)!} } $$
階乗をコンビネーションで書き換えると、
$$ = \frac{nM}{N} \sum_{x=1}^n \frac{{}_{M-1} C_{x-1}×{}_{N-M} C_{n-x}}{{}_{N-1} C_{n-1}} $$
\(n’=n-1,N’=N-1, M’=M-1, x’=x-1\)を用いて書き換えると(\(\Sigma\)の上は\(n’\)になることに注意)
$$ = \frac{nM}{N} \sum_{x’=0}^{n’} \frac{{}_{M’} C_{x’}×{}_{N’-M’} C_{n’-x’}}{{}_{N’} C_{n’}} $$
\(\Sigma\)部分は超幾何分布の確率関数をすべての\(x’\)について合計したもの、つまり1なので
$$ = \frac{nM}{N}$$

分散

$$ \mathrm{Var}[X]=\mathrm{E}[X^2] – \mathrm{E}[X]^2 $$
第1項を変形して
$$ =\mathrm{E}[X(X-1)+X] – \mathrm{E}[X]^2 $$
$$ =\mathrm{E}[X(X-1)]+\mathrm{E}[X] – \mathrm{E}[X]^2 $$
超幾何分布の確率関数と期待値の結果を代入して(\(x=0\)の時\(xP(X=0)=0\)だから\(x\geq1\)を考える)
$$ =\sum_{x=1}^n x(x-1)\frac{\frac{M!}{(M-x)!x!} × {}_{N-M} C_{n-x} }{ \frac{N!}{(N-n)!n!} }+\frac{nM}{N} – \frac{n^2 M^2}{N^2} $$
\(x=1\)の時\(\Sigma\)内は0になるので、\(x \geq 2\)だけ考えればよいので、
$$ =\sum_{x=2}^n \frac{M(M-1)}{\frac{N(N-1)}{n(n-1)}} \frac{\frac{(M-2)!}{(M-x)!(x-2)!} × {}_{N-M} C_{n-x} }{ \frac{(N-2)!}{(N-n)!(n-2)!} }+\frac{nMN – n^2 M^2}{N^2} $$
階乗をコンビネーションに変換
$$ =\frac{M(M-1)}{\frac{N(N-1)}{n(n-1)}} \sum_{x=2}^n \frac{{}_{M-2} C_{x-2} × {}_{N-M} C_{n-x} }{ {}_{N-2} C_{n-2} }+\frac{nMN – n^2 M^2}{N^2} $$
\(n’=n-2,N’=N-2, M’=M-2, x’=x-2\)を用いて式変形すると
$$ =\frac{M(M-1)}{\frac{N(N-1)}{n(n-1)}} \sum_{x’=0}^{n’} \frac{{}_{M’} C_{x’} × {}_{N’-M’} C_{n’-x’} }{ {}_{N’} C_{n’} }+\frac{nMN – n^2 M^2}{N^2} $$
\(\Sigma\)部分は超幾何分布の確率関数をすべての\(x’\)について合計したもの、つまり1なので
$$ =\frac{M(M-1)}{\frac{N(N-1)}{n(n-1)}} +\frac{nMN – n^2 M^2}{N^2} $$
式変形すると
$$ =\frac{nMN(n-1)(M-1) + nMN(N-1) – n^2 M^2(N-1)}{N^2(N-1)} $$
$$ =nM\frac{nMN – nN – MN + N + N^2 – N – nMN + nM}{N^2(N-1)} $$
$$ =nM\frac{- nN – MN + N^2 + nM}{N^2(N-1)} $$
$$ =\frac{nM}{N}\left(1-\frac{M}{N}\right)\frac{N-n}{N-1} $$

二項分布との比較

二項分布の期待値は
$$\mathrm{E}[X]=np $$
\(p=\frac{M}{N}\)とすると、
$$=\frac{nM}{N} $$
超幾何分布の期待値と一致する。

二項分布の分散は
$$\mathrm{Var}[X]=np(1-p)$$
\(p=\frac{M}{N}\)とすると、
$$ = \frac{nM}{N}\left(1-\frac{M}{N}\right)$$
これに 有限母集団修正\(\frac{N-n}{N-1}\)をかけると
$$ = \frac{nM}{N}\left(1-\frac{M}{N}\right) \frac{N-n}{N-1} $$
超幾何分布の期待値と一致する。

まとめ

“二項分布における事象の発生確率\(p\)” は ”超幾何分布における赤玉を取る確率\(\frac{M}{N}\)”
に対応している。

【期待値】
二項分布の期待値に\(p=\frac{M}{N}\)を代入すると超幾何分布の期待値になる。

【分散】
二項分布の分散に \(p=\frac{M}{N}\)を代入し、有限母集団修正 \(\frac{N-n}{N-1}\) をかけると超幾何分布の分散になる。
有限母集団修正は無限母集団\(N → ∞ \)を考えると1に収束する。

コメント