医療系の仕事をしています。生命の尊さ、美しさがどのようなメカニズムで生じるのかに興味があります。科学の方法論を用いて、このような問いに応えたい、私はこう思って医学生物学の基礎研究のトレーニングを受けてきました。生命を科学的手法を用いて理解を試みる上で、genomeを始めとした種々の大量データの処理が必要不可欠であることを痛感しました。また、生命科学が物理学、数学、統計学、有機化学などの種々の学問と深い関わりを持つことを実感しました。そのため、このブログは広範囲の学問領域に関しての記事を載せています。日々の学習内容を文書に書き残し、それを読み返すことによって、体系化された知識を身に付けることを目標としています。どうぞよろしくお願いします。
2群比較における検定方法の選択
『入門統計学』Ohmsha, 2011の206において、2群比較の検定法における選択基準が議論されています。
著者は、小標本であろうと大標本であろうと、parametricとnonparametricの両方の手法を用いた検定を推奨しています。
一般に、2群比較を行う場合、データの母集団が正規分布であるか検定を行います(ex. Shapiro test)。実験生物学の場面ではしばしば、サンプル数が5程度の小標本であることがあります。そういった場合、正規性の検定における検出力が小さく、正規性は棄却されません。一方、データ数を増やして行くと、検出力が上がりある程度の数になると大抵の場合、正規性が棄却されてしまします。そうしたジレンマを著者は指摘しています。
これを受けて著者は、「テキストによっては、標本サイズが小さい(データ数が少ない)場合にはノンパラメトリック手法を使うべきであると書いてあります。これは正しくもあり間違ってもいます。」と述べるに至っています。
しかし、私の経験上はあまりparametricとnonparametricの両手法による検定結果を併記しているケースに遭遇したことはありません。
【参考文献】
栗原 伸一『入門統計学』Ohmsha, 2011, 206pp