ハンバーガーショップで学ぶ楽しい統計学をR言語でなんとかしてみる (区間推定/信頼区間)

向後研究室が一般公開しているWeb教材
ハンバーガーショップで学ぶ楽しい統計学」を利用してR言語を学んでいこうシリーズです。
詳しくは第1回目
ハンバーガーショップで学ぶ楽しい統計学をR言語でなんとかしてみる (平均)からご覧ください。

区間推定/信頼区間

どんどん難しくなっていきます。
相変わらず教材はこちら
http://kogolab.chillout.jp/elearn/hamburger/chap2/sec3.htmlをみて勉強なさってください。

信頼区間の求め方

信頼区間 = 標本平均 ± t × 標本標準誤差

標本平均の分散 = (母分散/サンプルサイズ) = (不偏分散 / 標本数)

標本平均の標準偏差 = (不偏分散/サンプルサイズ)の平方根

ここで前回利用したポテトのサンプリングデータをロードしておきます。


sampling = scan("https://www.laddy.info/wp-content/uploads/2013/02/poteto_sampling.txt")
Read 10 items
> sampling
 [1] 47 51 49 50 49 46 51 48 52 49
> 

ここで前回求めた不偏分散が現れました。
しかし、私は一発で不偏分散を求める関数を知ってしまっているのでおもむろに解を求めます。


> var(sampling)
[1] 3.511111

あの学生時代手で計算していた苦労は何だったのでしょうか?

標準偏差誤差を求める


// 標準偏差誤差 = 平方根(不偏分散 / 要素数)
> sqrt(var(sampling) / length(sampling))
[1] 0.5925463

サンプルサイズが10のt分布をみてみると(自由度9) 2.262

信頼区間を求める

バラバラに求めてきましたが面倒になってきたので一気に求めます。


> mean(sampling) + 2.262 * sqrt(var(sampling) / length(sampling))
[1] 50.54034
> mean(sampling) - 2.262 * sqrt(var(sampling) / length(sampling))
[1] 47.85966

答え合わせ

教材の解は47.86 - 50.54でした。

信頼区間=49.2±2.262×0.592
    =49.2±1.34
    =47.86~50.54

導き出された解が50.54034 - 47.85966なので合っていそうです。

次回は練習問題をすっ飛ばしてカイ二乗検定へ入っていきます。