勝率と二項検定


サッカーのあるチームAがあるチームに対して、年間を通じて、Bチームと30試合を行い25勝5敗だったとします。
このデータから、チームAはチームBより強いと言えるでしょうか。
言い換えると、チームAのチームBに対する真の勝率は5割以上なのでしょうか。それとも、25勝5敗は誤差の範囲で勝ち越しているだけなのでしょうか。
この問題を解くには、二項検定という手法が用いられます。コインの裏表の出る確率の検定のときにも用いられる手法です。

#勝率が5割だったとした時の、勝利数の確率分布を描写する
> win <- 0:30
> plot(dbinom(win, 30, 0.5), type="h", xlab-"number of win")


#累積分布関数を描写する
> plot(pbinom(win, 30, 0.5), type="h", xlab="number of win")
#95%の水準に赤線を引く
abline(h=0.95, col="red")
#5%の危険率で二項検定を行う
#方法1
> 1 - pbinom(25, 30, 0.5)
[1] 2.973806e-05

#方法2
> pbinom(25, 30, 0.5, lower.tail=FALSE)
[1] 2.973806e-05

> pbinom(25, 30, 0.5, lower.tail=FALSE) < 0.05
[1] TRUE
> pbinom(25, 30, 0.5, lower.tail=FALSE) < 0.01
[1] TRUE

> binom.test(25,30, 0.5)

 Exact binomial test

data: 25 and 30 
number of successes = 25, number of trials = 30, p-value = 0.0003249
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.6527883 0.9435783 
sample estimates:
probability of success 
             0.8333333 

以上の計算結果から、チームAのチームBに対する勝率は有意に50%よりも大きいことが言えます。また、その信頼区間は0.65以上0.95以下です。

今回行った計算方法は、帰無仮説であるp=0.5を他の値に変更することによって、二項分布に従う様々な現象(打率、くじ引き etc)を説明することができます。

【参考文献】
山田剛史ほか『Rによるやさしい統計学』オーム社 2008 第12章