経営統計_08_標本分布

経営統計 08 標本分布分寺杏介神戸大学経営学部  [email protected] ※本スライドは，クリエイティブ・コモンズ表示-非営利 4.0 国際ライセンス（CC BY-NC 4.0）に従って利用が可能です。

https://creativecommons.org/licenses/by-nc/4.0/

前回のおさらい ▌確率分布を関数で表せたらだいぶ楽になってきた今回はこの部分例母集団分布が 𝑁(𝜇, 𝜎 2 ) の場合標本分布は 𝑁(? , ? ) になる？母集団分布例標本分布𝑁(? , ? )を生み出す母集団分布は 𝑁(𝜇, 𝜎 2 )と考えるのが最も妥当母平均は 𝜇 と考えるのが妥当だろう！ 08 標本分布例母集団分布に確率分布を仮定した場合標本分布も確率分布になります各標本の値と同じように標本統計量も確率変数だということです標本分布私達が実際に分かる範囲標本平均 𝑥ҧ 標本平均 𝑥ҧ を生み落とした標本分布は𝑁(? , ? )が最もしっくり来る 2

3.

標本分布とは ▌標本統計量の確率分布です「標本平均の標本分布」「標本分散の標本分布」「標本相関係数の標本分布」といった使い方をします ▌標本分布をもとに母数の統計的推測を行います母集団の平均値を推測するときには「標本平均の標本分布」を使います母集団の分散を推測するときには「標本分散の標本分布」を使います ▌具体的に標本分布はどんな分布になるのか？もちろん標本統計量によって異なります 08 標本分布 3

4.

標本分布は無限さ ▌少なくとも関数の種類 × 標本統計量の種類だけ存在するような気がする母集団分布が関数の種類標本統計量の種類正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ 標本平均標本分散標本中央値 ︙ 標本最大値標本相関係数 ︙ 実際にはのときのの標本分布 • よく使う（関心がある）標本統計量は平均値と分散くらい • 標本平均と標本分散の標本分布には関数の種類によらない特徴があるまずは標本平均の標本分布を見てみましょう 08 標本分布 4

5.

まずは直感的にここから先では，しばらくの間母集団分布には正規分布を仮定します ▌サンプルサイズと標本平均の関係性を考えてみる 𝑁 170,82 ざっくり分割全国の高校生の身長平均値±10cmのところで 3つに分けてみる 08 標本分布 5

6.

まずは直感的に ▌サンプルサイズと標本平均の関係性を考えてみる 1 𝑛 = 2のとき選ばれる組み合わせの確率 1人目＼2人目 Low Mid High Low 1.12% 8.33% 1.12% Mid 8.33% 62.20% 8.33% High 1.12% 8.33% 1.12% 𝑁 170,82 選ばれた2人で計算した標本平均 1人目＼2人目 Low Mid High Low かなり低いやや低い 170くらい Mid やや低い 170くらいやや高い High 170くらいやや高いかなり高い全国の高校生の身長 Lowの人とHighの人がいたら打ち消し合って平均的なところ（170）付近に落ち着く 08 標本分布 6

7.

まずは直感的に選ばれた人で計算した標本平均人目＼人目 ▌サンプルサイズと標本平均の関係性を考えてみる 1 全国の高校生の身長 𝑛 = 2のとき • 𝑁 170,82 かなり低いやや低いくらいやや低いくらいやや高いくらいやや高いかなり高いの人との人がいたら打ち消し合って平均的なところ（）付近に落ち着く平均的には170付近の人が選ばれやすい標本分布 • たまにすごく高い人・すごく低い人も選ばれるただし，1人が高い値でももう1人が低い値ならば標本平均は170くらいに落ち着いてくれる • 2人だけ選ぶと2人ともすごく低い可能性もありそうその場合標本平均も170よりすごく低くなる全国の高校生の身長標本平均の • 平均値は170くらいになりそうだ • でも170から大きく離れた値になる可能性もありそうだ 08 標本分布 7

8.

まずは直感的に ▌サンプルサイズと標本平均の関係性を考えてみる 2 𝑛 = 100のとき 100人の表は作れないので Highの人数 𝑁 170,82 Lowの人数ーの発生確率を出してみました（右に行くほど標本平均も大きい）全国の高校生の身長のそもそもMidの出現確率が高い上に LowとHighが相殺されることが増えるため 08 標本分布 100人の場合，High-Lowの人数差は高確率で10人以内 8

9.

まずは直感的に ▌サンプルサイズと標本平均の関係性を考えてみる 2 𝑛 = 100のときの • 平均的には170付近の人が選ばれやすい 𝑁 170,82 • たまにすごく高い人やすごく低い人も選ばれるただし，1人が高い値でももう1人が低い値ならば標本平均は170くらいに落ち着いてくれる • 100人もいると高い／低い人ばかりの可能性はほぼゼロ打ち消し合った結果，標本平均は170周辺に落ち着く可能性が高くなっている全国の高校生の身長標本平均の • 平均値は170くらいになりそうだ • 170から大きく離れた値になる可能性は先程より低そう 08 標本分布 9

10.

実際にデータを出して見てみる 1 2人選ぶ平均値の計算を10万回繰り返してみる 𝑛 = 2のとき 𝑁 170,82 1人目 2人目平均値 162.8 165.6 164.2 171.7 171.3 171.5 164.2 173.4 168.8 ︙ ︙ 186.8 全国の高校生の身長 10万個の標本平均ヒストグラムを描くと ︙ ︙ 167.7 177.2 標本平均が最小になった回では 2人の値が(154.2, 140.2)となりました標本平均標本平均の • 平均値は170くらいになりそうだ • でも170から大きく離れた値になる可能性もありそうだ 08 標本分布 10

11.

実際にデータを出して見てみる 2 100人選ぶ平均値の計算を10万回繰り返してみる 𝑛 = 100のとき 𝑁 170,82 1人目 … 100人目平均値 162.8 … 183.4 168.9 171.7 … 162.7 169.4 164.2 … 177.5 170.3 ︙ ︙ 186.8 全国の高校生の身長 … 10万個の標本平均ヒストグラムを描くと ︙ ︙ 161.4 169.0 標本平均は最小でも166.7でした標本平均標本平均の • 平均値は170くらいになりそうだ • 170から大きく離れた値になる可能性は先程より低そう 08 標本分布 11

12.

最後に理論的な結論を母集団分布が ▌ここまでで感じられたこと標本平均の標本分布の平均値は，母平均と同じ値っぽい関数の種類標本統計量の種類正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ 標本平均標本分散標本中央値 ︙ 標本最大値標本相関係数 ︙ 実際にはのときのの標本分布よく使う（関心がある）標本統計量は平均値と分散くらい標本平均と標本分散の標本分布には関数の種類によらない特徴があるまずは標本平均の標本分布を見てみましょう標本平均の標本分布の分散は，サンプルサイズが大きくなるほど小さいっぽい標本分布 ▌実際にそうなのです …ということがすでに判明しています母集団分布が正規分布 𝑁 𝜇, 𝜎 2 であるとき標本平均の標本分布は正規分布 𝑁 前ページまでの例では母集団分布が 𝑁(170, 82 ) だったので… 1 𝑛 = 2のとき 2 𝑛 = 100のとき 08 標本分布 𝜎2 𝜇, 𝑛 になる標本分布は 𝑁 82 170, 2 ≃ 𝑁 170, 5.662 標本分布は 𝑁 82 170, 100 ≃ 𝑁 170, 0.82 12

13.

（補足）再生性と変数変換の性質から標本平均の標本分布を得る資料07 p. 32 ① 同じ正規分布𝑁 𝜇, 𝜎 2 に従う確率変数𝑋𝑖 𝑖 = 1,2, ⋯ , 𝑛 を𝑛個足す 𝑋1 ∼ 𝑁 𝜇, 𝜎 2 , 𝑋2 ∼ 𝑁 𝜇, 𝜎 2 , ⋯ , 𝑋𝑛 ∼ 𝑁 𝜇, 𝜎 2 独立同分布に従う (i.i.d.) と言います 𝑛 個の和 𝑛 個の和正規分布の再生性から 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 ∼ 𝑁 𝜇 + 𝜇 + + ⋯ + 𝜇, 𝜎 2 + 𝜎 2 + ⋯ + 𝜎 2 𝑛 𝑛𝜎 2 ෍ 𝑋𝑛 ∼ 𝑁 𝑛𝜇,正規分布正規分布の性質 𝑖=1 ② サンプルサイズ𝑛で割る正規分布の変数変換の性質から変換確率変数が正規分布 ( , 変換した変数 + 2) にはうとき，に 2 2 + , う 𝑛 再生性 1 𝜎2 ෍ 𝑋𝑛 = 𝑥ҧ ∼ 𝑁 𝜇, 𝑛 𝑛な 𝑖=1 そのそのの確率変数 , がそれれ異なる正規分布 p. 19 との違いは，サンプルサイズが小さくても常に成り立つ，という点 + は正規分布 ( + も正規分布 ( 08 標本分布 2 , 2 + 2 )にう , 2 + 2 )にう 13 , 2 分散はちばらきの 2

14.

正規分布以外では？母集団分布が 17ページまでは母集団分布が正規分布の場合の話でした。 ▌では，母集団分布が正規分布ではなかったら？関数の種類標本統計量の種類正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ 標本平均標本分散標本中央値 ︙ 標本最大値標本相関係数 ︙ 実際にはのときのよく使う（関心がある）標本統計量は平均値と分散くらい標本平均と標本分散の標本分布には関数の種類によらない特徴があるまずは標本平均の標本分布を見てみましょう例当たり確率 5% の10連ガチャを引いたときの当たり回数の平均値の標本分布標本分布母集団分布 ① 10連ガチャを3回引いたときの平均あたり回 𝐵(10, 0.05) 平均値：10 × 0.05 = 0.5 ここから17ページまでのヒグラムは「10連ガチャを○回引く」をそれれ10万回繰り返して当たり回数の平均値を10万回計算した結果です分散：10 × 0.05 × 0.95 = 0. 75 標本平均なかなか当たらんよね… 母平均(0.5)付近が多いけどばらついている 08 標本分布の標本分布 14

15.

正規分布以外では？母集団分布が 17ページまでは母集団分布が正規分布の場合の話でした。 ▌では，母集団分布が正規分布ではなかったら？関数の種類標本統計量の種類正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ 標本平均標本分散標本中央値 ︙ 標本最大値標本相関係数 ︙ 実際にはのときのよく使う（関心がある）標本統計量は平均値と分散くらい標本平均と標本分散の標本分布には関数の種類によらない特徴があるまずは標本平均の標本分布を見てみましょう例当たり確率 5% の10連ガチャを引いたときの当たり回数の平均値の標本分布標本分布母集団分布 ② 10連ガチャを10回引いたときの平均あたり回 𝐵(10, 0.05) 平均値：10 × 0.05 = 0.5 分散：10 × 0.05 × 0.95 = 0. 75 標本平均なかなか当たらんよね… さっきよりばらつきは小さくなった気がする 08 標本分布の標本分布 15

16.

正規分布以外では？母集団分布が 17ページまでは母集団分布が正規分布の場合の話でした。 ▌では，母集団分布が正規分布ではなかったら？関数の種類標本統計量の種類正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ 標本平均標本分散標本中央値 ︙ 標本最大値標本相関係数 ︙ 実際にはのときのよく使う（関心がある）標本統計量は平均値と分散くらい標本平均と標本分散の標本分布には関数の種類によらない特徴があるまずは標本平均の標本分布を見てみましょう例当たり確率 5% の10連ガチャを引いたときの当たり回数の平均値の標本分布標本分布母集団分布 ③ 10連ガチャを100回引いたときの平均あたり回 𝐵(10, 0.05) 平均値：10 × 0.05 = 0.5 分散：10 × 0.05 × 0.95 = 0. 75 標本平均なかなか当たらんよね… 相当母平均(0.5)周辺に集まっている 08 標本分布の標本分布 16

17.

正規分布以外では？母集団分布が 17ページまでは母集団分布が正規分布の場合の話でした。 ▌では，母集団分布が正規分布ではなかったら？関数の種類標本統計量の種類正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ 標本平均標本分散標本中央値 ︙ 標本最大値標本相関係数 ︙ 実際にはのときのよく使う（関心がある）標本統計量は平均値と分散くらい標本平均と標本分散の標本分布には関数の種類によらない特徴があるまずは標本平均の標本分布を見てみましょう例当たり確率 5% の10連ガチャを引いたときの当たり回数の平均値の標本分布標本分布母集団分布 ④ 10連ガチャを10000回引いたときの平均あたり回 𝐵(10, 0.05) 平均値：10 × 0.05 = 0.5 分散：10 × 0.05 × 0.95 = 0. 75 標本平均なかなか当たらんよね… もう母平均(0.5)といっても過言ではない 08 標本分布の標本分布 17

18.

拡大して見てみると ④ 10連ガチャを10000回引いたときの平均あたり回見事に正規分布 0.47から0.53 の部分だけ拡大すると標本平均【わかったこと】標本平均 • 二項分布でも，サンプルサイズが大きくなると標本平均はほぼ母平均に一致する • 二項分布でも，サンプルサイズが大きくなると標本平均の標本分布は正規分布になるそういば，p. 8に出てきた棒グラフも正規分布っぽかったなぁ… 08 標本分布身長 Low Mid High 𝑥 -1 0 1 𝑃(𝑋 = 𝑥) 0.106 0.789 0.106 𝑛 = 100 の 18

19.

理論的には… law of large numbers 大 central limit theorem の法則中心極限定理母集団分布が正規分布でなくても何であっても母集団分布が正規分布でなくても何であっても母集団分布の平均を𝜇で表すと母集団分布の平均を𝜇，分散を𝜎 2 で表すとサンプルサイズが大きくなるほどサンプルサイズが十分に大きいと標本平均はどんどん母平均 𝜇 に収束していく標本平均の標本分布は 𝜎2 正規分布 𝑁 𝜇, に近づいていく 𝑛 ※厳密には「期待値が定義できるとき常に成り立つ」法則 ▲ こちらは標本平均以外のいくつかの標本統計量でも成り立つ ※厳密には「期待値と分散が定義できるとき常に成り立つ」定理例当たり確率 5% の10連ガチャを 𝑛 回引いたときの当たり回数の標本平均の標本分布母集団分布が 𝐵(10, 0.05) ということは平均0.5，分散0.475となるため 10連ガチャを 𝑛 回引いたときの当たり回数の標本平均の標本分布は 𝑁 0.5, 08 標本分布 0.475 𝑛 となる 19

20.

標本平均に関する推測｜母集団分布が正規分布の場合 ▌理論的な結果を当てはめたら母集団分布が 𝑁(𝜇, 𝜎 2 ) の場合標本分布は 𝑁 𝜎2 𝜇, 𝑛 になる私達が実際に分かる範囲標本分布母集団分布標本平均 𝑥ҧ 𝜎2 標本分布𝑁 𝑥,ҧ を生み出す母集団分布は 𝑛 𝑁(𝑥,ҧ 𝜎 2 )と考えるのが最も妥当母平均は 𝑥ҧ と考えるのが妥当だろう！ 08 標本分布標本平均 𝑥ҧ を生み落とした標本分布は𝑁 𝜎2 𝜇 = 𝑥,ҧ 𝑛 が最もしっくり来る 𝜎 2 がすでに分かっているとしたら 20

21.

標本平均に関する推測｜正規分布以外でも ▌更にいうと母集団分布が平均𝜇，分散𝜎 2 の場合標本分布は 𝑁 𝜎2 𝜇, 𝑛 母集団が正規分布じゃなくてもになる私達が実際に分かる範囲標本分布母集団分布標本平均 𝑥ҧ 𝜎2 𝑥,ҧ 𝑛 標本分布𝑁 を生み出す母集団分布ははともかく母平均は 𝑥ҧ と考えるのが妥当だろう！標本平均 𝑥ҧ を生み落とした標本分布は𝑁 𝜎2 𝜇 = 𝑥,ҧ 𝑛 が最もしっくり来る 𝜎 2 がすでに分かっているとしたら母集団が正規分布じゃなくても 08 標本分布 21

22.

続いて標本分散の標本分布母集団分布が ▌まずは母集団に正規分布を仮定した場合標本の分布実際にはのときのの標本分布よく使う（関心がある）標本統計量は平均値と分散くらい標本平均と標本分散の標本分布には関数の種類によらない特徴があるまずは標本平均の標本分布を見てみましょう標本分布確率密／ 𝑠𝑥2 ≈ 22 ／確率密 𝑠𝑥2 ≈ 82 ……… 𝑠𝑥2 ≈ 152 ／全国の高校生の身長標本平均標本分散標本中央値 ︙ 標本最大値標本相関係数 ︙ 標本分布 ……… 𝑁 170,82 標本分散正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ 標本分散の 𝑛 = 10のとき確率密 1 ずイメージを掴もう標本統計量の種類 08 標本分布確率密とり関数の種類サンプルサイズが小さいと標本自体がばらつく ▼ 標本分散もばらつく 22

23.

標本分散の標本分布母集団分布が ▌まずは母集団に正規分布を仮定した場合標本の分布実際にはのときのの標本分布よく使う（関心がある）標本統計量は平均値と分散くらい標本平均と標本分散の標本分布には関数の種類によらない特徴があるまずは標本平均の標本分布を見てみましょう標本分布確率密／ 𝑠𝑥2 ≈ 6.52 確率密／ 𝑠𝑥2 ≈ 82 ……… 全国の高校生の身長標本平均標本分散標本中央値 ︙ 標本最大値標本相関係数 ︙ 標本分布 ……… 𝑁 170,82 標本分散正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ 標本分散の 𝑛 = 100のとき 𝑠𝑥2 ≈ 92 確率密／ 2 ずイメージを掴もう標本統計量の種類 08 標本分布確率密とり関数の種類サンプルサイズが増えると標本のばらつきが減る ▼ 標本分散もまとまる 23

24.

標本分散の標本分布母集団分布が ▌まずは母集団に正規分布を仮定した場合標本の分布実際にはのときのの標本分布よく使う（関心がある）標本統計量は平均値と分散くらい標本平均と標本分散の標本分布には関数の種類によらない特徴があるまずは標本平均の標本分布を見てみましょう標本分布確率密／ 𝑠𝑥2 ≈ 7.92 ／確率密 𝑠𝑥2 ≈ 82 ……… 全国の高校生の身長標本平均標本分散標本中央値 ︙ 標本最大値標本相関係数 ︙ 標本分布 ……… 𝑁 170,82 標本分散正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ 標本分散の 𝑛 = 10000のとき 𝑠𝑥2 ≈ 8.12 確率密／ 3 ずイメージを掴もう標本統計量の種類 08 標本分布確率密とり関数の種類標本分散も最終的には一点に収束しそう 24

25.

理論的にはどのような分布になるのか ▌ちょっと回りくどい（ように見える）考え方をしていきます標本平均の標本分布標本分散の標本分布正規分布 𝜎2 𝑥ҧ ∼ 𝑁 𝜇, 𝑛 標準正規分布標本統計量自体の標本分布標準化したら 𝑥ҧ − 𝜇 = 𝑍 ∼ 𝑁(0,1) 𝜎 08 標本分布確率密ガンマ分布 𝑠𝑥2 ∼ 𝐺𝑎𝑚𝑚𝑎 𝑛 − 1 2𝜎 2 , 2 𝑛−1 理論的にはわかっているが使い勝手が悪い分布ここにあたる確率分布を紹介していきます 25

26.

標本分散の標本分布母集団分布が ▌標準化して考えていきます関数の種類標本統計量の種類正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ 標本平均標本分散標本中央値 ︙ 標本最大値標本相関係数 ︙ 実際には 𝑋 ∼ 𝑁(𝜇, 𝜎 2 ) 確率変数 𝑋 は平均 𝜇 分散 𝜎 2 の正規分布に従う，という意味ですのときのよく使う（関心がある）標本統計量は平均値と分散くらい標本平均と標本分散の標本分布には関数の種類によらない特徴があるまずは標本平均の標本分布を見てみましょう標本分布標準化 𝑋−𝜇 𝑍= ∼ 𝑁 0,12 𝜎 ここからは，標準化後(𝑍)の分散の標本分布を考えます ※ もとに戻す場合はられた確率分布を 𝜎 2 倍したら良いので ▌標準化された変数の分散はシンプル 𝑛 1 2 標本分散は𝑠𝑥 = ෍ 𝑥𝑖 − 𝑥ҧ 2 𝑛 𝑖=1 𝑛 1 2 𝑍 の標本分散は 𝑠𝑧 = ෍ 𝑧𝑖2 で求められる 𝑛 𝑖=1 単純に二乗和を取れば良いここで， 𝑍 2 の和の確率分布（標本分布）を紹介します ※ られた確率分布を 𝑛 で割れば 𝑠𝑧2 の確率分布になるので 08 標本分布の標本分布 26

27.

カイ二乗分布｜chi-square distribution ▌標準正規分布に従う独立な確率変数の二乗の和の確率分布 𝑘 𝑥 1 −1 −2 2 𝑓 𝑋 = 𝑥 = 𝑘/2 𝑥 𝑒 2 Γ 𝑘/2 関数パラメータ 𝑘 何個のかるいは自由 𝑖=1 𝑘 (degree of freedom) 略記 𝜒 2 (𝑘) または 𝜒𝑘2 平均値 𝑘 分散 2𝑘 𝜒 2 (1) 𝑛 1 2 𝑍 の標本分散は 𝑠𝑧 = ෍ 𝑧𝑖2 𝑛 カイ二乗分布は ෍ 𝑧 2 の確率分布 𝑖=1 和なので 𝑘 が大きいほど分布は右に 𝜒 2 (3) 08 標本分布 𝜒 2 (10) 27

28.

標本分散の標本分布は？母集団分布が正規分布 𝑁 𝜇, 𝜎 2 であるとき 𝑛 標本分散※を 𝑠𝑥2 と表すと 2 𝑠𝑥2 の標本分布は 𝜎 自由度 𝑛 のカイ二乗分布 𝜒 2 (𝑛) になる ▌ただし大きな問題が…… 𝑛 ෍ 𝑧𝑖2 = 𝑛 𝑖=1 𝑛 ▼※なので実は標本分散とも違う 𝑛 1 1 𝑥𝑖 − 𝜇 2 ෍ 𝑧𝑖 = 𝑛 ෍ 𝑛 𝑛 𝜎 𝑖=1 2 𝑖=1 ෍ 𝑧𝑖2 = 𝑛 𝑖=1 𝑛 𝑛 𝑖=1 𝑖=1 1 1 𝑥𝑖 − 𝑥ҧ 2 ෍ 𝑧𝑖 = 𝑛 ෍ 𝑛 𝑛 𝜎 𝑛 1 = 2 ෍ 𝑥𝑖 − 𝜇 2 𝜎 𝑛 𝑖=1 ▌とりあえず標本平均で標準化してみよう 𝑛 𝑛 𝜇 がわかっているなら計算出来るけど ▼これは標本分散 2 𝑛 𝑛 1 = 2 ෍ 𝑥𝑖 − 𝑥ҧ 2 𝜎 𝑛 𝑖=1 この場合でも標本分布は 𝜒 2 (𝑛) になるのか？ 08 標本分布 28

29.

カギを握るのが「自由」自由度じゆう，英 : degree of freedom とは，一般に，変数のうち独立に選べるものの数，すなわち，全変数の数から，それら相互間に成り立つ関係式（束縛条件，拘束条件）の数を引いたものでる。数に言ば，多様体の次元でる。 Wikipediaより ▌基本的には自由＝サンプルサイズ例｜2人の身長のデータの自由度 2人目 𝑥2 1人目と2人目は全く関係ないので，自由度は2 ▌統計量を考えるときには自由がいくつか減ることも例｜身長の平均値が170cmのときの2人の身長のデータの自由度 1人目の値によって2人目が決まってしまうので自由度は1 こでも良い 2次元 1人目の身長 𝑥1 2人目 𝑥2 𝑥1 + 𝑥2 = 170 2 の直上 1次元 1人目の身長 𝑥1 08 標本分布 29

30.

標本分散の標本分布の自由は？ 𝑧 は 𝑥ҧ に関して標準化されたもの 𝑥ҧ が変われば 𝑧 も変わるため ▌ポイントは「標準化」しているという点平均値を引いて標準偏差で割る 𝑥𝑖 標準化 𝑧𝑖 𝑥1 𝑧1 𝑥2 𝑧2 ⋮ ⋮ 𝑥𝑛−1 𝑧𝑛−1 𝑥𝑛 𝑧𝑛 標本平均 𝑥ҧ で標準化する場合 𝑥𝑖 標準化 𝑧𝑖 𝑥1′ 𝑥𝑖 − 𝑥ҧ 𝑧𝑖 = 𝜎 𝑧1′ 𝑥2 𝑧2′ ⋮ ⋮ 𝑥𝑛−1 ′ 𝑧𝑛−1 𝑥𝑛 𝑧𝑛′ 𝑥1 の値だけ変わる標本平均 𝑥ҧ も変わる 𝑧2 , 𝑧3 , ⋯ , 𝑧𝑛 も変わる 𝑥1 の値だけが変わると… 𝑥𝑖 母平均 𝜇 で標準化する場合（自由 𝑛） 08 標本分布 𝑥1′ 𝑥2 標準化 𝑥𝑖 − 𝜇 𝑧𝑖 = 𝜎 𝑧𝑖 𝑧1′ 𝑧2 ⋮ ⋮ 𝑥𝑛−1 𝑧𝑛−1 𝑥𝑛 𝑧𝑛 𝑥1 の値だけ変わる母平均 𝜇 は一定 𝑧1 以外には影響なし 30

31.

標本分散の標本分布 ▌標準化は「ある標本分布 𝑥ҧ 」のもとで行われている 𝑥𝑖 が1 変わったとき，同時に残りの 𝑛 − 1 個の 𝑧𝑖 の値も変動してしまう 𝑛 個の観測値が完全に自由な値を取れる (自由 𝑥ҧ は一定 𝑛 ) わけでは無い 𝑥𝑖 ▌では自由はいくつ？ 𝑥1 + 𝑘 𝑥2 𝑥𝑖 が1 変わっても標本平均 𝑥ҧ が変わらなければよい ⋮ 例えば 𝑥𝑛 = 𝑛𝑥ҧ − (𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛−1 ) と調整することにしたら残りは自由自由は 𝑛 − 1 になる 𝑥𝑛−1 𝑥𝑛 − 𝑘 𝑧 2 の和 ∼ 𝜒 2 (𝑛 − 1) ▼ まとめると母集団分布が正規分布 𝑁 𝜇, 𝜎 2 であるとき標準化した標本の二乗の和の標本分布は自由度 𝑛 − 1 のカイ二乗分布 𝜒 2 (𝑛 − 1) になる 1 𝑧 の分散 ∼ 𝑛 𝜒 2 (𝑛 − 1) ▼ 𝜎2 2 𝑥 の分散 ∼ 𝑛 𝜒 (𝑛 − 1) 普通はこんな表記しませんがわかりやすさ重視で 08 標本分布 31

32.

（補足）違和感があるけど同じようなこと ▌標準化みたいなことをしているだけ標本統計量そのものの標本分布標準化した標本統計量の標本分布 𝑛 𝜎2 1 に従う ෍ 𝑥𝑖 = 𝑥ҧ が 𝑁 𝜇, 𝑛 𝑛 標本平均 𝑥ҧ − 𝜇 = 𝑧ҧ が 𝑁 0,12 に従う 𝜎/ 𝑛 𝑖=1 標本分散（母平均未知） 𝑛 1 ෍ 𝑥𝑖 − 𝑥ҧ 2 = 𝑠𝑥2 が 𝑛 𝑖=1 ※ に従う 𝑛 𝑥𝑖 − 𝑥ҧ 2 𝑛 2 ෍ = 2 𝑠𝑥 が 𝜒 2 (𝑛 − 1) に従う 𝜎 𝜎 𝑖=1 ガンマ分布（ただしあまりそのような扱いは受けない）標本分散（母平均既知） 𝑛 1 ෍ 𝑥𝑖 − 𝜇 2 = 𝑠ǁ𝑥2 が 𝑛 ※ に従う 𝑖=1 𝑛 𝑥𝑖 − 𝜇 2 𝑛 ෍ = 2 𝑠ǁ𝑥2 が 𝜒 2 (𝑛) に従う 𝜎 𝜎 𝑖=1 08 標本分布 32

33.

（補足）標本分散の標本分布とサンプルサイズ ▌標本分散に関してもサンプルサイズが大きいほど標準偏差は小さい 𝜎2 標本分散の標本分布は𝜒 (𝑛 − 1) を倍したもの 𝑛 2 𝜒 (𝑛 − 1) の分散は 2(𝑛 − 1) なので 2 𝜎4 標本分散の標本分布の分散は 2 2 𝑛 − 1 𝑛 = 𝑛−1 4 × 2𝜎 𝑛2 𝑛 が大きくなるほど標準偏差は小さくなる標準偏差は 𝑛−1 4 × 2𝜎 2 𝑛 【𝜎 2 = 8 のとき】 𝑛 = 10 𝑛 = 100 𝑛 = 1000 標準偏差3.39 標準偏差1.13 標準偏差0.36 標本分散標本分散標本分散 08 標本分布 33

34.

もう少し一般化してみる母集団分布が ▌母集団分布が正規分布ではない場合は？ ※ ライドpp. 14-17と同じようにシミュレーションしてみる関数の種類標本統計量の種類正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ 標本平均標本分散標本中央値 ︙ 標本最大値標本相関係数 ︙ 実際にはのときのよく使う（関心がある）標本統計量は平均値と分散くらい標本平均と標本分散の標本分布には関数の種類によらない特徴があるまずは標本平均の標本分布を見てみましょう例当たり確率 5% の10連ガチャを引いたときの当たり回数の分散の標本分布母集団分布 ① 10連ガチャを3回引いたときのあたり回標本分布の分散標本分散の平均＝0.317 𝐵(10, 0.05) 平均値：10 × 0.05 = 0.5 ここから30ページまでのヒグラムは「10連ガチャを○回引く」をそれれ10万回繰り返して当たり回数の分散を10万回計算した結果です分散：10 × 0.05 × 0.95 = 0. 75 標本分散母分散(0.475)よりちょっと小さいのが多い？ 08 標本分布の標本分布 34

35.

もう少し一般化してみる母集団分布が ▌母集団分布が正規分布ではない場合は？ ※ ライドpp. 14-17と同じようにシミュレーションしてみる関数の種類標本統計量の種類正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ 標本平均標本分散標本中央値 ︙ 標本最大値標本相関係数 ︙ 実際にはのときのよく使う（関心がある）標本統計量は平均値と分散くらい標本平均と標本分散の標本分布には関数の種類によらない特徴があるまずは標本平均の標本分布を見てみましょう例当たり確率 5% の10連ガチャを引いたときの当たり回数の分散の標本分布母集団分布標本分布 ② 10連ガチャを10回引いたときのあたり回の分散標本分散の平均＝0.426 𝐵(10, 0.05) 平均値：10 × 0.05 = 0.5 分散：10 × 0.05 × 0.95 = 0. 75 標本分散やっぱり母分散(0.475)よりちょっと小さい？ 08 標本分布の標本分布 35

36.

もう少し一般化してみる母集団分布が ▌母集団分布が正規分布ではない場合は？ ※ ライドpp. 14-17と同じようにシミュレーションしてみる関数の種類標本統計量の種類正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ 標本平均標本分散標本中央値 ︙ 標本最大値標本相関係数 ︙ 実際にはのときのよく使う（関心がある）標本統計量は平均値と分散くらい標本平均と標本分散の標本分布には関数の種類によらない特徴があるまずは標本平均の標本分布を見てみましょう例当たり確率 5% の10連ガチャを引いたときの当たり回数の分散の標本分布母集団分布標本分布 ③ 10連ガチャを100回引いたときのあたり回の分散標本分散の平均＝0.470 𝐵(10, 0.05) 平均値：10 × 0.05 = 0.5 分散：10 × 0.05 × 0.95 = 0. 75 標本分散母分散(0.475)に近づいてきたけどまだ小さい？ 08 標本分布の標本分布 36

37.

もう少し一般化してみる母集団分布が ▌母集団分布が正規分布ではない場合は？ ※ ライドpp. 14-17と同じようにシミュレーションしてみる関数の種類標本統計量の種類正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ 標本平均標本分散標本中央値 ︙ 標本最大値標本相関係数 ︙ 実際にはのときのの標本分布よく使う（関心がある）標本統計量は平均値と分散くらい標本平均と標本分散の標本分布には関数の種類によらない特徴があるまずは標本平均の標本分布を見てみましょう例当たり確率 5% の10連ガチャを引いたときの当たり回数の分散の標本分布母集団分布標本分布 ④ 10連ガチャを10000回引いたときのあたり回の分散標本分散の平均＝0.475 𝐵(10, 0.05) 平均値：10 × 0.05 = 0.5 分散：10 × 0.05 × 0.95 = 0. 75 標本分散ここまで来たらさすがに母分散(0.475)付近 08 標本分布 37

38.

2 のをる場合，標準化している点で標本平均は理論的には標本における 2 の和 ▌中心極限定理みたいなものはないですが… 標本平均がならば = ( + + + 1 母集団分布が標本平均はに関して標準化されたもの標本分散標本中央値が変わればも変わるためのときのの標本分布正規分布二項分布ポアソン分布 ︙ ガンマ分布負の二項分布 ︙ まずは標本平均の標本分布を見てみましょう 2 まとめると 𝑛−1 2 標本分散の標本分布の期待値は 2 𝜎 となる , 𝑛 ちょっとだけ小さいカイ二乗分布｜ ▌もちろん母集団分布が正規分布のときも 2 1 ( 1) 標本分散の標本分布は𝜒 2 (𝑛 − 1)の倍 𝑛 標本分布 𝜒 2 (𝑛 − 1) の期待値は 𝑛 − 1 なのでの和標本分布の分散 1 の分散 2 2 ( 2 1) ( 1) 2 ( 1) 2 1 2 標準正規分布に従う独立な確率変数の二乗の和の関数 = = 1 2 /2 /2 何個のかるいは自由パラメータ 𝑛−1 2 標本分散の期待値はやはり 𝜎 𝑛 ︙ 標本最大値標本相関係数 ︙ よく使う（関心がある）標本統計量は平均値と分散くらい標本平均と標本分散の標本分布には関数の種類によらない特徴がある実際には具体に何分布になるかは母集団によって変わるが 𝜎2 標本統計量の種類関数の種類 1 ) でないといけない 2 母集団分布が正規分布でなくても何であっても自由は 1 になる母集団分布の分散を𝜎 2 で表すと定される略記 2( カイ ) または 2 平均値分散 2 2 (1) 08 標本分布の 2 (3) 38

39.

標本分散に関する推測 ▌理論的な結果を当てはめたら母集団分布が平均𝜇，分散𝜎 2 の場合の標本分布は母集団が正規分布じゃなくても 𝑛−1 2 はともかく期待値が 𝜎 になる 𝑛 標本分布母集団分布は母集団分布による 𝑛−1 2 とにかく期待値が 𝜎 𝑛 私達が実際に分かる範囲標本分散 𝑠𝑥2 標本分散期待値が𝑠𝑥2 になる標本分布を生み出す母集団分布は 𝑛 はともかく母分散は 𝑠𝑥2 と考えるのが妥当だろう！標本分散 𝑠𝑥2 を生み落とした標本分布の期待値は当然 𝑠𝑥2 が最もしっくり来る 𝑛−1 上の青い部分の逆数 08 標本分布 39

40.

標本分散に関する推測 ▌母集団分布が正規分布だったら母集団分布が 𝑁(𝜇, 𝜎 2 ) の場合 𝜎2 2 標本分布は 𝜒 (𝑛 − 1) になる 𝑛 正確には標準化した値の和の標本分布が𝜒 2 (𝑛 − 1) 標本分布母集団分布私達が実際に分かる範囲標本分散 𝑠𝑥2 標本分散 𝑠𝑥2 標本分布 𝜒 2 (𝑛 − 1)を生み出す母集団分布は 𝑛−1 𝑛 𝑁 𝑥,ҧ 𝑠𝑥2 と考えるのが最も妥当 𝑛−1 𝑛 母分散は 𝑠𝑥2 と考えるのが妥当だろう！ 𝑛−1 08 標本分布標本分散 𝑠𝑥2 を生み落とした 𝑠𝑥2 標本分布は 𝜒 2 (𝑛 − 1)が最もしっくり来る 𝑛−1 𝜎 2 のところに 𝑛 𝑠𝑥2 を代入したもの 𝑛−1 詳細は次回！ 40

41.

（補足）標本分布が必ず一点に収束するとは限らない確率密その最たる例が極値統計学と呼ばれるものフレシェ分布 Fréchet Disbribution の一種例 1日の株価の変動率 𝑛 = 2 （2日）パレート分布 𝛼 𝑓 𝑋 = 𝑥 𝑥min , 𝛼 = 𝛼𝑥min 𝑥 −(𝛼+1) 標本最大値 𝑛 = 30 （1ヶ月） 𝑛 日間におる「変動率の最大値」は？標本最大値確率密極まれに大きな変動が起こる確率密度多くの日では大きな変動は起きない 𝑋 ∼ Pareto(𝑥min = 0.01, 𝛼 = 2) 𝑛 = 365 （1年）標本最大値 08 標本分布 𝑛 が大きいほど「極端」の発生機会が増える ▼ 最大値の標本分布は広がっていく 41

42.

中心極限定理の証明補足資料 08 標本分布 42

43.

（前提知識）母関数以後，関数𝑓(𝑥)を𝑛回微分したものを 𝑓 𝑛 𝑥 とします。 generating function ▌母関数（生成関数）数列のすべての項を生み出せることから「母」関数と呼ばれているようです数列の情報をすべて含む関数数列 𝒂 = 𝑎1 , 𝑎2 , ⋯ , 𝑎𝑘 , ⋯ の通常型母関数は【使い方の一例】母関数が分かれば一般項 𝑎𝑛 を簡単に求められる ∞ 𝑓 𝑥 = ෍ 𝑎𝑘 𝑥 𝑘 やりかた 𝑘=0 母関数を𝑛回微分して𝑥 = 0を置いたものを𝑛! で割るだ例数列 𝒂 = 𝑎1, 𝑎2, ⋯ , 𝑎𝑘 , ⋯ = {1,2,∞⋯ , 𝑘, ⋯ } の通常型母関数は 𝑓𝑛 0 𝑎𝑛 = 𝑛! 𝑓 𝑥 = ෍ 𝑘𝑥 𝑘 = 𝑥 + 2𝑥 2 + 3𝑥 3 + ⋯ + 𝑘𝑥 𝑘 + ⋯ 𝑘=0 例ば3回微分すると𝑓 (3) 𝑥 𝑓3 0 = 3 ⋅ 3! + (𝑥の含まれる項)となるため，確かに 𝑎3 = 3! =3 とりあえず「なにかの列をすべて生み出せるもの」が母関数だと思ってくださいポイント母関数と数列は一対一対応 08 標本分布 ∞ ∞ ෍ 𝑎𝑘 𝑥 𝑘 = ෍ 𝑏𝑘 𝑥 𝑘 ⟺ 𝒂 = 𝒃 𝑘=0 𝑘=0 43

44.

（前提知識）モーメント母関数資料02 pp. 37-39 moment-generating function モーメン＝「るからの偏」に関する量 ▌モーメント（積率）母関数モーメントの情報をすべて含む関数確率分布𝑓(𝑋 = 𝑥)のモーメン母関数は【使い方の一例】 𝑛 次のモーメントを簡単に求められる ∞ 𝑀𝑋 𝑡 = 𝐸 𝑒 𝑡𝑋 = まり𝑒 の期待値 𝑡𝑋 න 𝑒 𝑡𝑥 𝑓 𝑥 𝑑𝑥 やりかた 𝑥=−∞ 𝑡にいて𝑛回微分して𝑡 = 0を入するだ離散型の場合は和に変わるだけ (𝑛) 𝐸(𝑋 𝑡 ) = 𝑀𝑋 例正規分布のモーメン母関数は𝑀𝑋 𝑡 = exp 𝜇𝑡 + 1 𝜎 2𝑡 2 0 計算は次ページ 2 1 ちなみに分散は (1) 𝑡 = 𝜇 + 𝜎 2 𝑡 exp 𝜇𝑡 + 2 𝜎 2 𝑡 2 となるため𝑀𝑋 (2) 𝑡 = 𝜎 2 + 𝜇 + 𝜎 2 𝑡 2 exp 𝜇𝑡 + 2 𝜎 2 𝑡 2 となり， 𝑀𝑋 𝑡にいて1回微分すると𝑀𝑋 𝑡にいて2回微分すると𝑀𝑋 (1) 1 0 =𝜇 (2) (2) 𝑀𝑋 𝑡 − 𝑀𝑋1 𝑡 0 = 𝜎 2 + 𝜇2 とりあえず「すべてのモーメントを生み出せるもの」だと思ってくださいポイントモーメント母関数と確率分布は一対一対応 08 標本分布平均・分散を始め全てのモーメンが一致するので 44 𝟐

45.

（補足）正規分布のモーメント母関数の導出モーメント母関数正規分布の確率密 ∞ 𝑀𝑋 𝑡 = 𝐸 𝑒 𝑡𝑋 = න 𝑒 𝑡𝑥 𝑓 𝑥 𝑑𝑥 𝑥−𝜇 2 𝑓 𝑥 = exp − 2𝜎 2 2𝜋𝜎 2 1 に 𝑥=−∞ ∞ 𝑀𝑋 𝑡 = න exp 𝑡𝑥 𝑥=−∞ ∞ = න 𝑥=−∞ 関数 𝑥−𝜇 2 exp − 𝑑𝑥 2 2 2𝜎 2𝜋𝜎 1 𝑥−𝜇 2 exp 𝑡𝑥 − 𝑑𝑥 2 2 2𝜎 2𝜋𝜎 1 を代入 𝑒 𝑡𝑥 と exp(𝑡𝑥) は同じです exp(𝑎) exp 𝑏 = 𝑒 𝑎 𝑒 𝑏 = exp(𝑎 + 𝑏) 𝑥にいて平方完成させると − 1 1 2 𝑡𝑥 + 𝑥 2 − 2𝜇𝑥 + 𝜇 2 = − −2𝜎 𝑥 2 − 2 𝜇 + 𝜎 2 𝑡 𝑥 + 𝜇2 2 2 2𝜎 2𝜎 1 = − 2 𝑥 2 − 2 𝜇 + 𝜎 2 𝑡 + 𝜇 + 𝜎 2 𝑡 2 − 2𝜇𝜎 2 𝑡 − 𝜎 2 𝑡 2 2𝜎 1 1 = − 2 𝑥 − 𝜇 + 𝜎 2 𝑡 2 + 𝜇𝑡 + 𝜎 2 𝑡 2 2𝜎 2 08 標本分布 45

46.

（補足）正規分布のモーメント母関数の導出（続き） ∞ 𝑀𝑋 𝑡 = න 𝑥=−∞ ∞ = න 𝑥=−∞ 𝑥−𝜇 2 exp 𝑡𝑥 − 𝑑𝑥 2 2 2𝜎 2𝜋𝜎 1 1 2𝜋𝜎 2 exp − 1 = exp 𝜇𝑡 + 𝜎 2 𝑡 2 2 1 𝑥 − 𝜇 + 𝜎 2𝑡 2 2𝜎 ∞ න 𝑥=−∞ 2 1 + 𝜇𝑡 + 𝜎 2 𝑡 2 2 𝑥 − 𝜇 + 𝜎 2𝑡 exp − 2 2𝜎 2 2𝜋𝜎 1 𝑑𝑥 前ページの平方完成を反映させる 2 積分と無関係な項を前に出す 𝑑𝑥 正規分布𝑁(𝜇 + 𝜎 2 𝑡, 𝜎 2 )の確率密関数正規分布𝑁(𝜇, 𝜎 2 )の確率密関数 𝑥−𝜇 2 𝑓 𝑥 = exp − 2 2𝜎 2 2𝜋𝜎 1 正規分布の全領域の面積なので1になる正規分布 𝑁(𝜇, 𝜎 2 )のモーメント母関数は 1 𝑀𝑋 𝑡 = exp 𝜇𝑡 + 𝜎 2 𝑡 2 2 08 標本分布 46

47.

（補足）正規分布のモーメント母関数の微分 1 正規分布のモーメント母関数は𝑀𝑋 𝑡 = exp 𝜇𝑡 + 2 𝜎 2 𝑡 2 ▌ 1回微分する 𝑒の微分のルール • 𝑒 𝑥 を微分すると 𝑒 𝑥 合成関数の微分 1 2 2 𝑀𝑋 𝑡 = exp 𝜇𝑡 + 𝜎 𝑡 2 1 𝜇𝑡 + 𝜎 2 𝑡 2 = 𝑢とおくと， 𝑀𝑋 𝑡 = exp 𝑢 2 これを微分すると 𝑑𝑢 1 (1) 𝑀𝑋 𝑡 = exp 𝑢 = (𝜇 + 𝜎 2 𝑡) exp 𝜇𝑡 + 𝜎 2 𝑡 2 𝑑𝑡 2 ▌ 2回微分する (1) 𝑀𝑋 𝑡 = (𝜇 + 𝜎 2 𝑡) exp 𝑢 𝑓 𝑥 = 𝜇 + 𝜎 2 𝑡, 𝑔 𝑥 = exp 𝑢 としてこれを微分すると (2) 𝑀𝑋 𝑡 = 𝑓 (1) 𝑥 𝑔 𝑥 + 𝑓 𝑥 𝑔(1) (𝑥) = 𝜇 + 𝜎 2 𝑡 (1) exp 𝑢 + 𝜇 + 𝜎 2 𝑡 exp 𝑢 (1) = 𝜎 2 exp 𝑢 + 𝜇 + 𝜎 2 𝑡 2 exp 𝑢 1 2 2 2 2 2 = 𝜎 + 𝜇 + 𝜎 𝑡 exp 𝜇𝑡 + 𝜎 𝑡 2 08 標本分布関数 𝑓(𝑥) を 𝑥 にいて微分したいとき 𝑓(𝑥)の一部を 𝑢 とおくことで 𝑑𝑓(𝑥) 𝑑𝑓(𝑥) 𝑑𝑢 𝑓1 𝑥 = = 𝑥 𝑑𝑢 𝑑𝑥 と分解して微分をラクにできるかも積の微分２の関数の積𝑓 𝑥 𝑔(𝑥)の微分は 𝑓 (1) 𝑥 𝑔 𝑥 + 𝑓 𝑥 𝑔(1) (𝑥) で求められる 47

48.

（前提知識）特性関数 characteristic function ∞ 実数の範囲内で‫=𝑥׬‬−∞ 𝑒 𝑡𝑥 𝑓 𝑥 𝑑𝑥の積分が収束しないことがりその場合モーメン母関数は存在しないことになってしまいます ▌特性関数モーメント母関数の一般化確率分布𝑓(𝑋 = 𝑥)の特性関数は【使い方の一例】 𝑛 次のモーメントを簡単に求められる ∞ 𝜑𝑋 𝑡 = 𝐸 𝑒 𝑖𝑡𝑋 = まり𝑒 𝑖𝑡𝑋 の期待値 න 𝑒 𝑖𝑡𝑥 𝑓 𝑥 𝑑𝑥 やりかた 𝑥=−∞ 𝑡にいて𝑛回微分して𝑡 = 0を離散型の場合は和に変わるだけ例正規分布の特性関数は𝜑𝑋 𝑡 = exp 𝜇𝑖𝑡 − 1 𝜎 2𝑡 2 2 入して𝑖 𝑛 で割るだ 𝑛 𝜑 0 𝐸(𝑋 𝑡 ) = 𝑋 𝑛 𝑖 モーメン母関数がる場合は 𝑡 を 𝑖𝑡 に置き換るだ 1 (1) 𝑡 = 𝜇𝑖 − 𝜎 2 𝑡 exp 𝜇𝑖𝑡 − 2 𝜎 2 𝑡 2 となるため𝜑𝑋 (2) 𝑡 = 𝜎 2 − 𝜇𝑖 − 𝜎 2 𝑡 2 exp 𝜇𝑖𝑡 − 2 𝜎 2 𝑡 2 となり， 𝜑𝑋 𝑡にいて1回微分すると𝜑𝑋 𝑡にいて2回微分すると𝜑𝑋 (1) 1 0 =𝜇 (2) ちなみに分散は (2) 𝜑𝑋 𝑡 − 𝜑𝑋1 𝑡 0 = 𝜎 2 + 𝜇2 シンプルにモーメント母関数の一般化だと思ってくださいポイント特性関数と確率分布は一対一対応 08 標本分布平均・分散を始め全てのモーメンが一致するので 48 𝟐

49.

（前提知識）テイラー展開関数をるにおいて多項式で近似する方法関数 𝑓(𝑋 = 𝑥)の𝑥 = 𝑎 周りでのイラー展開は 𝑓 (1) 𝑎 𝑓 𝑥 =𝑓 𝑎 + 1! 【実際の使用 𝑓 (2) 𝑎 𝑥−𝑎 + 2! (𝑘) 𝑎 𝑓 𝑥−𝑎 2+⋯= ෍ 𝑘! 𝑥−𝑎 𝑘 𝑘=0 】適当な項までしか使わない 𝑛 𝑓 (𝑘) 𝑎 𝑓 𝑥 =෍ 𝑘! 𝑘=0 誤差として無視 ∞ 𝑓 (𝑘) 𝑎 𝑘 𝑥−𝑎 + ෍ 𝑘! 𝑥−𝑎 𝑘 𝑘>𝑛 例 𝑓 𝑥 = exp(𝑥) を𝑥 = 0 で近似マクローリン展開した場合 • １次の近似： 𝑓 0 特に𝑎 = 0 周りでの展開はマクローリン展開と呼ばれます ∞ 𝑓(1) 0 + 1! 𝑥 = 1 + 𝑥 • 𝑓(2) 0 ２次の近似：1 + 𝑥 + 2! • 1 2 𝑓(3) 0 ３次の近似：1 + 𝑥 + 2 𝑥 + 3! 𝑛 𝑓 (𝑘) 𝑎 𝑓 𝑥 ≃෍ 𝑘! 𝑥−𝑎 𝑘 𝑘=0 exp(𝑥) 𝑥 が０に近いところではうまく近似できている 1 = 1 + 𝑥 + 2 𝑥2 1 1 = 1 + 𝑥 + 2 𝑥2 + 6 𝑥3 08 標本分布次数が多いほど近似の性能が良くなる 49

50.

ようやく中心極限定理の証明正規分布𝑁 𝜇, 𝜎 2 に限らず方針1 （連続性定理）もし期待値 𝜇 ，分散 𝜎 2 の確率分布に従う確率変数 𝑋 の標本平均 𝑋ത の特性関数が正規分布 𝑁 𝜎2 𝜇, 𝑛 2 𝜎 の特性関数と一致していたら，標本平均 𝑋ത は正規分布𝑁 𝜇, 𝑛 に分布収束するといえる 𝑛 標本平均 1 𝜎2 ത 𝑋 = ෍ 𝑥𝑖 は，期待値 𝜇，分散になるので 𝑛 𝑛 𝑖=1 標準化した値 𝑍ҧ = 方針2 まだ正規分布になるかはわからないがとりあえず期待値と分散は分かる段階確率分布が何でっても期待値 𝑎𝜇𝐴 , 𝑎𝜇𝐵 の2変数のの期待値は 𝑎𝜇𝐴 + 𝑎𝜇𝐵 分散 𝑏𝜎𝐴2 , 𝑏𝜎𝐵2 の2変数のの分散は𝑏 2 𝜎𝐴2 + 𝑏 2 𝜎𝐵2 𝑋ത − 𝜇 は，期待値 0，分散 1 になる 𝜎 2/ 𝑛 もし標準化した標本平均 𝑍ҧ の特性関数が標準正規分布 𝑁 0, 1 の特性関数と一致していたら 𝑍ҧ は𝑁 0,1 に分布収束する 𝜎 𝑋ത は𝑁 𝜇, 2 𝑛 に分布収束するといえる標本平均 𝑍ҧ の特性関数 𝜑𝑍ത 𝑡 の中身を見ていきます 08 標本分布 50

51.

中心極限定理の証明続き方針2 もし標準化した標本平均 𝑍ҧ の特性関数が標準正規分布 𝑁 0, 1 の特性関数と一致していたら 𝑍ҧ は𝑁 0,1 に分布収束する 𝜎 𝑋ത は𝑁 𝜇, 2 𝑛 に分布収束するといえる 𝜑𝑍ത 𝑡 = 𝐸 exp 𝑖𝑡𝑍ҧ ここで 𝜑𝑧 𝑋ത − 𝜇 = 𝐸 exp 𝑖𝑡 2 𝑍ҧ をもとに戻す 𝜎 𝑛 1 𝑛 σ𝑖=1 𝑥𝑛 − 𝜇 𝑛 𝑋ത をもとに戻す = 𝐸 exp 𝑖𝑡 𝜎2 𝑛 𝑛 1 𝑥𝑖 − 𝜇 exp() の中身を全て = 𝐸 exp ෍ 𝑖𝑡 2 シグマ関数の中に押し込む 𝑛 𝜎 𝑖𝑡 𝑛 𝑛 乗の中身ををマクローリン展開すると 1 𝑖𝑡 𝜑𝑧 0 = 𝜑𝑧 0 + 1! 𝑛 𝜑𝑧 𝜑𝑧 𝑖=1 𝑛 𝑖𝑡 𝑧 = 𝐸 exp 𝑖𝑡 𝑛 𝑛 𝑧𝑖 は期待値𝜑𝑧 1 𝑧𝑖 𝑥 −𝜇 = 𝐸 exp ෍ 𝑖𝑡 𝑧𝑖 = 𝜎𝑖 2 とおく標 𝑛 𝑖=1 𝑧1 𝑧2 𝑧𝑛 exp(𝑎 + 𝑏) = exp 𝑎 exp(𝑏) = 𝐸 exp 𝑖𝑡 exp 𝑖𝑡 ⋯ exp 𝑖𝑡 𝑛 𝑛 𝑛 𝑛 𝑖𝑡 𝜑𝑍ത 𝑡 = 𝜑𝑧 ҧ 𝑍ではなく 𝑧𝑖 の特性関数を使って書き換る 𝑛 08 標本分布 𝜑𝑧 2 𝑖𝑡 𝜑𝑧 0 + 2! 𝑛 ∞ = න 𝑒 𝑖𝑡 𝑧 𝑛 𝑓 𝑧 𝑑𝑧 𝑖𝑡 𝑛 2 + 誤 ∞ より 𝜑𝑧 0 = 𝑧=−∞ 𝑧=−∞ 2 0 = 0，分散𝜑𝑧 𝑖𝑡 1 =1− 2 𝑛 න 𝑓 𝑧 𝑑𝑧 = 1 1 0 − 𝜑𝑧 𝑡 𝑛 0 2 = 1 なので 2 + (誤 ) 𝑡2 したがって 𝜑𝑍ത 𝑡 = 1 − 2𝑛 + 誤 𝑛 51

52.

中心極限定理の証明続き方針2 もし標準化した標本平均 𝑍ҧ の特性関数が標準正規分布 𝑁 0, 1 の特性関数と一致していたら 𝑍ҧ は𝑁 0,1 に分布収束する 𝜎 𝑋ത は𝑁 𝜇, 2 𝑛 に分布収束するといえる 𝑡2 + 誤標準化した標本平均 𝑍ҧ の特性関数 𝜑𝑍ത 𝑡 = 1 − 2𝑛 𝑛 誤は小さいので無視します 𝑡2 𝑥 𝑛 を用いると 𝜑𝑍ത 𝑡 = 1 − ここで，指数関数の定義 exp 𝑥 = lim 1 + 2𝑛 𝑛→∞ 𝑛 ここで極限をとっているため，中心極限定理はサンプルサイズが大きいときに近似的に成り立つ正規分布 𝑁 𝜇, 𝜎 2 の特性関数は𝜑𝑋 𝑡 = exp 1 𝜇𝑖𝑡 − 2 𝜎 2 𝑡 2 標正規分布 𝑁 0,1 の特性関数は𝜑𝑋 𝑡 = exp 𝑡2 −2 2 𝑛 = 1+ 𝑡 2 𝑛 − 𝑛 𝑡2 = exp − 2 ポインは， p.42の段階では分布を指定せずに確率分布の「期待値 𝜇 ，分散 𝜎 2 」だ決めたこと母集団分布が正規分布でなくても何であっても分布収束が成り立つことが示せたというわけで， 𝑍ҧ の特性関数𝜑𝑍ത 𝑡 が𝑁 0,1 の特性関数に一致することが示されました。特性関数と確率分布は一対一対応なので， 𝑍ҧ の確率分布は近似的に 𝑁 0,1 となる 2 𝜎 したがって，標本平均 𝑋ത の確率分布も近似的に 𝑁 𝜇, 𝑛 となる 08 標本分布 52

経営統計_08_標本分布

Kyosuke Bunji

関連スライド

ベイズ統計_07_マルコフ連鎖モンテカルロ法(2)

ベイズ統計_02_確率の基本とベイズの定理

ベイズ統計_01_イントロダクション

ベイズ統計_03_尤度

ベイズ統計_04_事前分布・基本的なベイズ推論(1)

ベイズ統計_06_マルコフ連鎖モンテカルロ法(1)

各ページのテキスト