Student's t-test による二群間比較

#データの読み込み

> t.test.data <- read.table("/home/kappa/デスクトップ/kappa/2011/1103/統計学:Rを用いた入門書/t.test.data.txt", header = T)

#データの概観

> t.test.data
   gardenA gardenB
1        3       5
2        4       5
3        4       6
4        3       7
5        2       4
6        3       4
7        1       3
8        3       5
9        5       6
10       2       5


par(mfrow =c(1,2))
plot(gardenA, main = "gardenA")
abline( h = mean(gardenA))
for ( i in 1:length(gardenA)){
lines(c(i,i), c(mean(gardenA), gardenA[i]))
}
plot(gardenB, main = "gardenB")
abline( h = mean(gardenB))
for ( i in 1:length(gardenB)){
lines(c(i,i), c(mean(gardenB), gardenB[i]))
}


> par(mfrow = c(1,3))
> attach(t.test.data)
> hist(gardenA)
> hist(gardenB)
> boxplot(t.test.data)

#正規性の検定

> qqnorm(gardenA)
> qqline(gardenA)
> qqnorm(gardenB)
> qqline(gardenB)

> shapiro.test(gardenA)

    Shapiro-Wilk normality test

data:  gardenA
W = 0.9529, p-value = 0.7026

> shapiro.test(gardenB)

    Shapiro-Wilk normality test

data:  gardenB


#等分散の検定

> 2 * (1 - pf(var(gardenA)/var(gardenB), length(gardenA)-1, length(gardenB)-1)) > 0.05
[1] TRUE

> var.test(gardenA, gardenB)

    F test to compare two variances

data:  gardenA and gardenB
F = 1, num df = 9, denom df = 9, p-value = 1
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.2483859 4.0259942
sample estimates:
ratio of variances
                 1
#Student t検定(gardenA, gardenBは正規分布。さらに、二つの分散は等しいため)

> t.test(gardenA, gardenB, var.equal = T)

    Two Sample t-test

data:  gardenA and gardenB
t = -3.873, df = 18, p-value = 0.001115
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -3.0849115 -0.9150885
sample estimates:
mean of x mean of y
        3         5

#ちなみに分散が等しくないときはWelchのt検定

> t.test(gardenA, gardenB, var.equal = F)

    Welch Two Sample t-test

data:  gardenA and gardenB
t = -3.873, df = 18, p-value = 0.001115
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -3.0849115 -0.9150885
sample estimates:
mean of x mean of y
        3         5

#ちなみにこのサンプルにWilicoxonを用いると

> wilcox.test(gardenA, gardenB)

    Wilcoxon rank sum test with continuity correction

data:  gardenA and gardenB
W = 11, p-value = 0.002988
alternative hypothesis: true location shift is not equal to 0

 警告メッセージ:
In wilcox.test.default(gardenA, gardenB) :
   タイがあるため、正確な p 値を計算することができません

#Wilcoxon検定のp値の方がt検定のp値よりも大きい。つまり、Wilcoxonの方が保守的であるといえる。"誤差が正規的でないとき"、ノンパラメトリック検定はt検定よりも優れて適切な検定である。