幾何分布 geometric distribution






#災害の生じる確率
p <- 0.04
year <- 1: 30

#幾何分布に従う乱数を生成
dgeom(year, prob=p, log = FALSE)
 [1] 0.03840000 0.03686400 0.03538944 0.03397386 0.03261491 0.03131031
 [7] 0.03005790 0.02885558 0.02770136 0.02659331 0.02552957 0.02450839
[13] 0.02352805 0.02258693 0.02168346 0.02081612 0.01998347 0.01918413
[19] 0.01841677 0.01768010 0.01697289 0.01629398 0.01564222 0.01501653
[25] 0.01441587 0.01383923 0.01328566 0.01275424 0.01224407 0.01175431

result <- c()
result <- dgeom(year, prob=p, log = FALSE)

#resultの各要素に年数を当てる。
names(result) <- year

png("121224_geometric.png")
barplot(result, ylab="probability", xlab="waiting time (year)", main="Example of geometric distribution")
abline(h = 0)
dev.off()

#分布関数を作図
result2 <- c()
result2 <- pgeom(year, prob=p, lower.tail=T, log.p =F)

#resultの各要素に年数を当てる。
names(result2) <- year

#X年後以内に災害の起こる確率を棒グラフで描写
png("121223_geo_cum.png")
barplot(result2, ylab="Cumulative probability", xlab="waiting time (year)", main="Example of geometric cumulative distribution")
abline(h=0)
abline(h = 0.336, v = 11 , col="red")
dev.off()





####数式ソースファイル####
% geometry.tex
\documentclass[a4j]{jarticle}
\usepackage{amsmath}

\begin{document}
確率$p$のベルヌーイ試行を行い、最初に成功が出現するまでの試行回数を$x$とすると、$x=1,2,3,\dots$である。$q=1-p$とおくと、その確率は、
\begin{eqnarray}
f(x) = pq^x - 1
\end{eqnarray}
となる。
このような確率分布を幾何分布 geometric distributionと呼ぶ。
幾何分布の期待値と分散は
\begin{eqnarray}
E(X) = 1/p \\
V(X) = q/p^2
\end{eqnarray}
となる。幾何分布は初めてイベントが発生するまでの待ち時間分布 waiting time distributionと呼ばれる。
ここで参考文献の117ppで取り扱われている超幾何分布の例についてRで計算を行う。災害については時事トピックとしても大変興味深い。\\ \\
<例>災害の到来 ある風水害は1年について確率0.04($p = 0.04$)で起こる。こ
れが起こるのは平均的($E(X) = 1/p$)に何年後か。
また、10年以内に起こる確率($F(x) = P(X \leq x)$ )はなにほどか。\\
\begin{eqnarray}
E(X) = 1/p = 1/0.04 = 25 \\
F(x) = \sum^{10}_{k=1}f(x) = \sum^{10}_{k=1} (0.04)(1-0.04)^{k-1}
= 1 - (0.96)^10 = 0.336
\end{eqnarray}
最後に、Rを用いて、例題の条件で災害が発生するまでの時間とその確率について
棒グラフを描く。
\\
\\
【参考文献】 \\
東京大学教養部統計学教室(1991) 『統計学入門』 東京大学出版 116 - 118pp.
\pagestyle{empty}
\end{document}