第一種の誤りとは
「帰無仮説が真のとき、これを棄却してしまう」
誤りのことです。
そして、第一種の誤りを犯す確率をαとして、有意水準または危険率と一般に呼びます。
第一種の誤りについてもう少し直感的に理解するには、条件付き確率を扱っていることを認識する必要があります。
すなわち、危険率とは
- 帰無仮説が真のとき(こういう条件の下だと)
- これを棄却してしまう確率
ということなのです。
ですので、あくまで「帰無仮説が正しいとき」を想定しなければ、危険率αのニュアンスはわからないのです。
正規分布からのサンプルの平均値の検定を題材にして、危険率αとはどのようなものなのかということをシミュレーションを通じて考えてみたいと思います。
今、平均値μ、分散σ^2/μの正規分布(標準正規分布)から、サンプリング(n)を行い、標本平均の分布について考えたいと思います。
一般に平均μ、分散σ^2の正規分布から抽出されたサンプル(n)の平均値の分布は平均値μ、分散σ^2/nの正規分布に従うとされます。
サンプルの平均値を標準化して、
を考えます。Zは標準正規分布に従います。
それでは、平均値12、分散9の正規分布の集団からn=5のサンプリングを行い、その平均値の分布について計算してみます。
一回の試行は以下のようにして行うことができます。
> rnorm(mean=12, sd=3, n=5)
[1] 15.039414 9.264087 11.036560 16.033761 11.038038
Zの値は以下のようにして計算します。
> (mean(rnorm(mean=12, sd=3, n=5) - 12)/(3/sqrt(5)))
[1] 13.86206
ところで、標準正規分布を描写すると以下のようになります。
> curve(dnorm(x), -3, 3)
ここで、上側確率、下側確率を計算してグラフに記入
> qnorm(0.025)
[1] -1.959964
> qnorm(0.975)
[1] 1.959964
> abline(v=qnorm(0.025), col="red")
> abline(v=qnorm(0.975), col="red")
それでは今回想定している平均値12、分散9の正規分布の集団からn=5のサンプリングを繰り返し(300回)行い、その都度Z値を計算しています。これらのZ値のうち、上側下側合わせて5%の区間にどの程度入ってくるか調べます。
> curve(dnorm(x), -3, 3)
> abline(v=qnorm(0.025), col="green")
> abline(v=qnorm(0.975), col="green")
> for(i in 1 : 100){
+ abline(v=(mean(rnorm(mean=12, sd=3, n=5) - 12)/(3/sqrt(5))), col = "magenta")
+ }
確かに、このように繰り返し平均値をもとめていると、
「帰無仮説は正しい」
のにも関わらず、一定の割合でサンプルの平均値は5%以下の確率で生じるとされる区間に入ってきてしまいます。
従って、ある検定を行いたいと考えたときに、サンプルの統計量が偶然には起こりそうにも無い値であったとしても、帰無仮説が誤っている可能性の他に、危険率αの確率で帰無仮説が正しい場合にも同様の統計量が計算される可能性があるといえるのです。
【参考文献】
山田剛史ほか『Rによるやさしい統計学』オーム社 2008 109-119pp