95%信頼区間の平均のブートストラップ

3
Gandalf_the_Green 2018-06-24 01:10.

私はR使ったModernData Scienceの本を読んでいますが、ブートストラップと信頼区間について概念的な質問があります。

平均1000回ブートストラップを実行するとします。95%の信頼区間をどのように取得しますか?この本のデモンストレーションによると、.025、.975分位数を計算するだけです。なぜそうなのか誰かが説明できますか?このプロセスに、t検定で行うような信頼区間を計算するおなじみの手順が含まれていないのはなぜだろうか。

私が取り組んでいる本の演習の特定の例への参照を必要とするRユーザーがいる場合に備えて、ここにあります。

https://mdsr-book.github.io/instructor/foundations-ex.html

私はRを使用しており、2番目の演習のデータはMosaicDataパッケージで利用可能なGestationデータセットです。

この質問は、最初の演習と2番目の演習の違いによって促されました。最初の演習では、t.test関数を使用して簡単に解いた信頼区間を計算するように求められました。

私が最初にMosaicパッケージで解決した2番目の演習(本のデモンストレーションに続く)ですが、答えが機能する「理由」を本当に知りませんでした。(本は手順を示しましたが、説明しませんでした)

したがって、基本的に、リサンプリング(ブートストラップなど)を使用して1,000程度の平均を取得し、適切な分位数を取得することで、95%の信頼区間を取得できるのはなぜか疑問に思っています。

1 answers

1
BruceET 2018-06-24 22:11.

これは、ノンパラメトリックブートストラップ信頼区間の例です-それがどのように取得されるかについての説明があります。

私が持っているとしましょう $n = 30$ 未知の分布からの観測値で、母平均の95%信頼区間が必要 $\mu.$ (括弧内の数字は無視してください。)

y
 [1] 22.1 25.9 30.3  6.7 18.1 13.6 13.4 40.4 14.9 37.3 16.9 22.1 26.3 24.7 39.6
[16] 27.0 22.5 11.1 10.8 31.4 38.4 22.3 30.4 24.3 26.5 31.7 14.0 13.9 49.2 47.9
mean(y)
[1] 25.12333

私は取る $\bar Y = 25.12333,$以下a.obsのプログラムで、の点推定として示されています。$\mu.$

信頼区間(CI)を作成するには、平均値周辺の母集団の変動性について知る必要があります。私が分布pfを知っていれば$D = \bar Y = \mu,$ 数字が見つかりました $L$ そして $U,$ そのような $P(L \le D = \bar Y - \mu \le U) = 0.95.$ それなら私は $P(\bar Y - U \le \mu \le \bar Y - L) = 0.95$ および95%CI $\mu$ 次の形式になります $(\bar Y - U, \bar Y - L).$

値がわからない $L$ そして $U,$ 見積もりを取得するために「ブートストラップの世界」に入ります $L^*$ そして $U^*$これらの値のそれぞれ。瞬間的に、私は観察されたものを取ります$\bar Y$ 未知の代理として $\mu.$ たくさん取る $B$データの「再サンプル」の。各リサンプルのサイズは$n = 30$再サンプルが採取される元のサンプルから交換。

再サンプルごとに、平均値を見つけます $\bar Y^*$ そして $D^* = \bar Y^* - \bar Y.$ これは私に $B$$D^*.$ このコレクションの下端と上端から2.5%カットしました $D^*$必要な値を見つけるには $L^*$ そして $U^*.$

「現実の世界」に戻って、 $\bar Y$ サンプルの観測された平均としての元の役割に戻り、95%のノンパラメトリックブートストラップCI $\mu$ の形式です $\bar Y - U^*, \bar Y - L^*).$

次のRプログラムでは、.re代わりにサフィックスが使用されています$*$は、リサンプリングと観測の結果として生じる量を示します。 $\bar Y$と呼ばれa.obsます。プログラムは、データyがすでに存在していることを前提としています。

set.seed(624);  B = 10^4;  d.re = numeric(B)
a.obs = mean(y);  n = length(y)
for (i in 1:B) {
  a.re = mean(sample(y, n, repl=T))
  d.re[i] = a.re - a.obs }
L.re = quantile(d.re, .025);  U.re = quantile(d.re, .975)
c(a.obs - U.re,  a.obs - L.re)
   97.5%     2.5% 
21.14325 28.88333 

したがって、95%のノンパラメトリックブートストラップCI $\mu$ です $(21.1, 28.9).$set.seedステートメント を省略すると、プログラムを実行するたびにわずかに異なる結果が得られます。上記の正確な答えを複製するために、そのステートメントを保持します。しかし、$B = 10,000$実行ごとの反復の違いはわずかです。未知のシードを使用した2回目の実行で、間隔が与えられました$(21.2, 29.0).$

95%tの信頼区間は $(21.0, 29.2).$これは、データが正規であるという仮定に基づいています(そして、正規母集団の対称的な裾を考慮しています)。ブートストラップCIは、データが平均値を持つ母集団からのランダムサンプルであると想定しています。$\mu$。これは、母集団が観測された値を生成できることのみを前提としています。

注:(1)データyは、形状パラメーター5および平均25のガンマ分布からランダムにサンプリングされました。

(2)これは「バイアス補正済み」のブートストラップCIです。バイアス補正のないバージョンは、ブートストラップしてCIとしてa.re使用することquantile(a.re, c(.025,.975))です。一部の作成者はそれを行い、を使用してバイアス補正を遡及的に適用します2*a.obs - quantile(a.re, c(.025,.975))。(これは上記のプログラムと同等ですが、その役割を説明するのはそれほど簡単ではありません2*a.obs。)

Related questions

MORE COOL STUFF

「水曜日」シーズン1の中心には大きなミステリーがあります

「水曜日」シーズン1の中心には大きなミステリーがあります

Netflixの「水曜日」は、典型的な10代のドラマ以上のものであり、実際、シーズン1にはその中心に大きなミステリーがあります.

ボディーランゲージの専門家は、州訪問中にカミラ・パーカー・ボウルズが輝くことを可能にした微妙なケイト・ミドルトンの動きを指摘しています

ボディーランゲージの専門家は、州訪問中にカミラ・パーカー・ボウルズが輝くことを可能にした微妙なケイト・ミドルトンの動きを指摘しています

ケイト・ミドルトンは、州の夕食会と州の訪問中にカミラ・パーカー・ボウルズからスポットライトを奪いたくなかった、と専門家は言う.

一部のファンがハリー・スタイルズとオリビア・ワイルドの「非常に友好的な」休憩が永続的であることを望んでいる理由

一部のファンがハリー・スタイルズとオリビア・ワイルドの「非常に友好的な」休憩が永続的であることを望んでいる理由

一部のファンが、オリビア・ワイルドが彼女とハリー・スタイルズとの間の「難しい」が「非常に友好的」な分割を恒久的にすることを望んでいる理由を見つけてください.

エリザベス女王の死後、ケイト・ミドルトンはまだ「非常に困難な時期」を過ごしている、と王室の専門家が明らかにする 

エリザベス女王の死後、ケイト・ミドルトンはまだ「非常に困難な時期」を過ごしている、と王室の専門家が明らかにする 

エリザベス女王の死後、ケイト・ミドルトンが舞台裏で「非常に困難な時期」を過ごしていたと伝えられている理由を調べてください.

セントヘレナのジェイコブのはしごを登るのは、気弱な人向けではありません

セントヘレナのジェイコブのはしごを登るのは、気弱な人向けではありません

セント ヘレナ島のジェイコブズ ラダーは 699 段の真っ直ぐ上る階段で、頂上に到達すると証明書が発行されるほどの難易度です。

The Secrets of Airline Travel Quiz

The Secrets of Airline Travel Quiz

Air travel is far more than getting from point A to point B safely. How much do you know about the million little details that go into flying on airplanes?

Where in the World Are You? Take our GeoGuesser Quiz

Where in the World Are You? Take our GeoGuesser Quiz

The world is a huge place, yet some GeoGuessr players know locations in mere seconds. Are you one of GeoGuessr's gifted elite? Take our quiz to find out!

バイオニック読書はあなたをより速く読むことができますか?

バイオニック読書はあなたをより速く読むことができますか?

BionicReadingアプリの人気が爆発的に高まっています。しかし、それは本当にあなたを速読術にすることができますか?

ラーム・エマニュエルがシカゴ警察の警視を解雇し、身を守る

ラーム・エマニュエルがシカゴ警察の警視を解雇し、身を守る

シカゴ市長のラーム・エマニュエルは、シカゴの警察官による17歳のラカン・マクドナルドの銃撃の失敗した取り扱いに続いて、市の警視官、ギャリーF.マッカーシーを解雇しました。

ダグ・マローネの理想的な食事は、ボローニャのサンドイッチです。

ダグ・マローネの理想的な食事は、ボローニャのサンドイッチです。

写真:ローガンボウルズ/ゲッティイメージズジャイアンツがベンマカドゥーを解雇したので、他の誰かがジムトムスラの精神的後継者でなければなりません。季節だった。ジャガーズのダグ・マローネ監督は、孤独なボローニャサンドイッチに親しみを持っていることを考えると、すでにその役割を担う有力な候補者のようです。

人々がやめる最も一般的な時間、およびプッシュスルーする方法

人々がやめる最も一般的な時間、およびプッシュスルーする方法

時には、それが副次的なプロジェクト、仕事、人間関係、または人生の他の部分であるかどうかにかかわらず、辞めることが最良の選択肢です。しかし、何かを完了するためのリソースがないため、物事が困難になったとき、タイミングが私たちに必要なように「感じ」させたときにも、私たちは辞めます。

黒人女性、あなたの内訳へようこそ

黒人女性、あなたの内訳へようこそ

著者のベニルデ・リトルは、母親の死後のうつ病との戦いを新しい回想録「Welcome toMyBreakdown」で記録しています。チェスター・トイの作家ベニルデ・リトルは、黒人女性にそれが大丈夫だと知ってもらいたいと思っています。

ケイト・ミドルトンとウィリアム王子は、彼らが子供たちと行っているスパイをテーマにした活動を共有しています

ケイト・ミドルトンとウィリアム王子は、彼らが子供たちと行っているスパイをテーマにした活動を共有しています

ケイト・ミドルトンとウィリアム王子は、子供向けのパズルの本の序文を書き、ジョージ王子、シャーロット王女、ルイ王子と一緒にテキストを読むと述べた.

事故で押しつぶされたスイカは、動物を喜ばせ水分補給するために野生生物保護団体に寄付されました

事故で押しつぶされたスイカは、動物を喜ばせ水分補給するために野生生物保護団体に寄付されました

Yak's Produce は、数十個のつぶれたメロンを野生動物のリハビリ専門家であるレスリー グリーンと彼女のルイジアナ州の救助施設で暮らす 42 匹の動物に寄付しました。

デミ・ロヴァートは、新しいミュージシャンのボーイフレンドと「幸せで健康的な関係」にあります: ソース

デミ・ロヴァートは、新しいミュージシャンのボーイフレンドと「幸せで健康的な関係」にあります: ソース

8 枚目のスタジオ アルバムのリリースに向けて準備を進めているデミ ロヴァートは、「スーパー グレート ガイ」と付き合っている、と情報筋は PEOPLE に確認しています。

Plathville の Kim と Olivia Plath が数年ぶりに言葉を交わすことへようこそ

Plathville の Kim と Olivia Plath が数年ぶりに言葉を交わすことへようこそ

イーサン プラスの誕生日のお祝いは、TLC のウェルカム トゥ プラスビルのシーズン 4 のフィナーレで、戦争中の母親のキム プラスと妻のオリビア プラスを結びつけました。

仕事の生産性を高める 8 つのシンプルなホーム オフィスのセットアップのアイデア

仕事の生産性を高める 8 つのシンプルなホーム オフィスのセットアップのアイデア

ホームオフィスのセットアップ術を極めよう!AppExert の開発者は、家族全員が一緒にいる場合でも、在宅勤務の技術を習得しています。祖父や曽祖父が共同家族で暮らしていた頃の記憶がよみがえりました。

2022 年、私たちのデジタル ライフはどこで終わり、「リアル ライフ」はどこから始まるのでしょうか?

20 年前のタイムトラベラーでさえ、日常生活におけるデジタルおよびインターネットベースのサービスの重要性に驚くことでしょう。MySpace、eBay、Napster などのプラットフォームは、高速化に焦点を合わせた世界がどのようなものになるかを示してくれました。

ニューロマーケティングの秘密科学

ニューロマーケティングの秘密科学

マーケティング担当者が人間の欲望を操作するために使用する、最先端の (気味が悪いと言う人もいます) メソッドを探ります。カートをいっぱいにして 3 桁の領収書を持って店を出る前に、ほんの数点の商品を買いに行ったことはありませんか? あなたは一人じゃない。

地理情報システムの日: GIS 開発者として学ぶべき最高の技術スタック

地理情報システムの日: GIS 開発者として学ぶべき最高の技術スタック

私たちが住んでいる世界を確実に理解するには、データが必要です。ただし、空間参照がない場合、このデータは地理的コンテキストがないと役に立たなくなる可能性があります。

Language