推測統計学 inferential statistics


近代統計学理論の基礎の建設者であるKarl Pearson(1851 - 1936)は、、統計学のことを "The Grammar of Science" と読んでいたそうです。これは、研究室で実験をしていると実感できることであると思います。
ところで、かつては現象の法則性をしるために、すべてを丹念に調べ(全数調査)、規則性から法則性を見いだす作業が行われていました。この統計学的手法のことを記述統計学 descriptive statisticsと呼びます。
記述統計学に対して、現代の統計学は一部を観察して、そこから論理性のある推測で全体の法則性の発見に至る手法が用いられています。このことを統計的推測 statistical inferenceと呼びます。またこのような統計学の分野を推測統計学 inferential statisticsと呼びます。

推測統計学を確率するにあたり、Pearsonは標本 sampleと母集団 populationの二つを明確に区別し、そこに確率論を本格的に導入した.
Pearsonが推定、仮説検定という土台を築き、それを基盤としてRonald Fisher(1890 - 1962)が、分散分析、実験計画法などの今日の統計学の中心的な手法を築き上げたそうです。

<推測統計学における重要な用語>
母集団 population : 本来、その特性を知りたいとわれわれが願う対象。数が膨大であったり(しばしば無限であることもある)、調査に費用がかかったり、未来ことであったりするために、全数調査ができないことが多い。

標本 sample : 母集団から分析のために選び出された要素

母集団分布 population distriution : 母集団のもつ分布。無限母集団(N=∞)であることがおおいため、確率分布f(x)を考えることが多い。別に、f(x)は連続型でも離散型でも良い。

#実際の分析においては、母集団分布の事前の過程において二つの取り扱い方がある。
パラメトリック parametric : 事前に母集団分布がある知られた確率分布であることが、理論的・経験的に分かっている場合
ノンパラメトリック nonparametric : 母集団分布の具体的な形が事前に不明の場合。この場合は、母集団分布にかかわらず広く定義できるパラメータで母集団分布を分析する。


母数 parameter : 母集団分布を決定する定数。
統計量 statistic : 標本を要約し、母集団の母数 parameterのいろいろな推測に使用されるもの。例) 標本平均、標本分散、最大値、最小値、etc.



【参考文献】 

東京大学教養部統計学教室(1991) 『統計学入門』 東京大学出版 1,2,6, 176, 177, 178, 179pp.