経営統計_07_代表的な確率分布

8K Views

December 08, 23

#経営統計 #確率分布 #二項分布 #ポアソン分布 #ベルヌーイ分布

スライド概要

神戸大学経営学部で2022年度より担当している「経営統計」の講義資料「07_代表的な確率分布」を公開用に調整したものです。
【更新履歴】
・2025/04/01：(p. 17)幾何分布の定義とプロットが一貫していなかったので修正，(p. 42)ポアソン分布が近似する正規分布の表記を修正
・2024/11/22：(p. 17) 幾何分布の期待値が間違っていたのを修正

Kyosuke Bunji

@BunjiRo

スライド一覧

神戸大学経営学研究科准教授　分寺杏介（ぶんじ・きょうすけ）です。主に心理学的な測定・教育測定に関する研究を行っています。講義資料や学会発表のスライドを公開していきます。 ※スライドに誤りを見つけた方は，炎上させずにこっそりお伝えいただけると幸いです。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

ベイズ統計_07_マルコフ連鎖モンテカルロ法(2)

Kyosuke Bunji 62K

ベイズ統計_02_確率の基本とベイズの定理

Kyosuke Bunji 51.2K

ベイズ統計_01_イントロダクション

Kyosuke Bunji 45.6K

ベイズ統計_03_尤度

Kyosuke Bunji 43.2K

ベイズ統計_04_事前分布・基本的なベイズ推論(1)

Kyosuke Bunji 41.3K

ベイズ統計_06_マルコフ連鎖モンテカルロ法(1)

Kyosuke Bunji 39.6K

各ページのテキスト

経営統計 07 代表的な確率分布分寺杏介神戸大学経営学部  [email protected] ※本スライドは，クリエイティブ・コモンズ表示-非営利 4.0 国際ライセンス（CC BY-NC 4.0）に従って利用が可能です。

https://creativecommons.org/licenses/by-nc/4.0/

前回のおさらい ▌統計的推測に必要な情報は母集団分布と標本分布の関係性資料05 p. 23 母集団分布が○○の場合標本分布は△△になる？母集団分布資料05 pp. 26-27 標本分布標本的には標本分布が△△だと最もしっくり来るので母集団分布は○○と考えるのが妥当だろう 07 代表的な確率分布 2

前回のおさらい ▌母集団分布の可能性は無限大資料05 p. 23 母集団分布母集団分布が○○の場合標本分布は△△になるこの○○をどうやって説明する？ x=150では0.004で，x=151では0.006で，… 離散確率変数ですらほぼ無理関数による表現を考えます 07 代表的な確率分布 3

確率分布を関数で表そう …といってもなんでもいいわけじゃない二次関数 ▌確率のルール（公理）を満たしている必要がある負の値をとらない関数でないといけない「和が1」は高さを適当に調整したら良いので気にしなくてOKです ▌それなりにシンプルである必要がある複雑な関数パラメータの数はせいぜい2, 3個にしておきたい数学的に扱いやすい関数でないといけない ▌そもそも確率分布は何かしらの現象を表したもの実質的な意味を持った関数でないといけないそんな関数はそこまで多くない（と言われている） 07 代表的な確率分布「そんな関数」の例を見ていきます 4

離散確率分布 07 代表的な確率分布 5

二項分布高校数学の内容からスタート問（あたり確率が0.1の）くじを3回引いたとき，ちょうど1回だけ当たる確率は？ ▌公式がありましたな 1回目 2回目 3回目その事象が起こるパターンの数 1 2 C × 0.1 × 0.9 3 1 発生確率のうち「当たり」の部分発生確率のうち「はずれ」の部分計発生確率 ○ ○ ○ 3 0.1 × 0.1 × 0.1 ○ ○ × 2 0.1 × 0.1 × 0.9 ○ × ○ 2 0.1 × 0.9 × 0.1 ○ × × 1 0.1 × 0.9 × 0.9 × ○ ○ 2 0.9 × 0.1 × 0.1 × ○ × 1 0.9 × 0.1 × 0.9 × × ○ 1 0.9 × 0.9 × 0.1 × × × 0 0.9 × 0.9 × 0.9 07 代表的な確率分布 6

二項分布一般化しましょう問（あたり確率が 𝑝 の）くじを 𝑛 回引いたとき，ちょうど 𝑥 回だけ当たる確率は？ ▌公式を書き直せば例当たり確率 𝑝 = 0.1，回数 𝑛 = 3の場合その事象が起こるパターンの数 𝑥 𝑛−𝑥 C × 𝑝 × (1 − 𝑝) 𝑛 𝑥 発生確率のうち「当たり」の部分発生確率のうち「はずれ」の部分ちょうど0回 0 3 3C0 × 0.1 × 0.9 ちょうど1回 1 2 3C1 × 0.1 × 0.9 ちょうど2回 2 1 3C2 × 0.1 × 0.9 ちょうど3回 3 0 3C3 × 0.1 × 0.9 この図には𝑝 = 0.1, 𝑛 = 3の場合に取りうる値の全パターンとその確率が表示されていることになります各点の高さをすべて足すと１になっている 07 代表的な確率分布 7

二項分布｜Binomial distribution さっきの二項分布関数パラメータも 𝑃 𝑋 = 𝑥 = 𝑛C𝑥 𝑝 𝑥 1 − 𝑝 𝑛−𝑥 𝑝 当たり確率 𝑛 試行回数の略記 𝐵(𝑛, 𝑝) 平均値 𝑛𝑝 分散 𝑛𝑝(1 − 𝑝) を的なの = はを ( , , ) の率なのでではり ▌パラメータを変えると様々な形の関数が書ける 𝐵(𝑛 = 5, 𝑝 = 0.7) 𝐵(𝑛 = 10, 𝑝 = 0.5) 𝐵(𝑛 = 50, 𝑝説明 = 0.3) 意味分布の分的な数のをのは分布のらりはりてくさいないですが確率数確率分布 07 代表的な確率分布 8

代表的な関数のポイント ▌確率分布の背後には「メカニズムの仮定」がある【二項分布の場】社会科学で用いられるほとんどの確率分布は特定のメカニズムを仮定しています得られる結果が2種類コインの表裏，くじの当たり外，PKの成功失敗など各事象が出現する確率が途中で変わらない例｜本来PKは繰り返しや対戦相手などで成功確率がわが，そういった動は無いみなすある試行の結果がそれ以後の試行に影響しない例｜一番くじの場各試行は独立当たり確率は毎回（わかで）動す ▌記号や略記は人によって少し異なるので要注意二項分布の場 𝑝 の代わりに 𝜋 を使う人や𝐵𝑖𝑛𝑜𝑚(𝑛, 𝑝) 書く人などがい回帰分析が 𝑦 = 𝑎𝑥 𝑏で 𝑦 = 𝛽0 𝛽1 𝑥 で良いように，分かれば良いのです 07 代表的な確率分布 9

10.

特殊な二項分布ベルヌーイ分布 ▌結果が二通りしかない確率的な試行の確率分布ベルヌーイ試行 𝑛 回繰り返したら二項分布結果は二通りなので𝑋は0か1しからない関数パラメータ 𝑥 𝑃 𝑋 =𝑥 =𝑝 1−𝑝 𝑝 1−𝑥 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(0.3) 当たり確率略記 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝) たは𝐵(1, 𝑝) 平均値 𝑝 分散 𝑝(1 − 𝑝) 07 代表的な確率分布 10

11.

ポアソン分布カウントデータの場合シオン・ドニ・ポアソン(1781-1840) Wikipediaより ▌ポアソン過程に基づく事象の回数確率的に発生す事象が一定時間のうちに何回起こったかたしその事象は基本的に起こりにくい各事象はほかの事象は無係「一定時間」のフレムを小さくした場事象が起こりやすくな確ほぼ０いうこ的なのは無し ▌ ポアソン分布に合う事象の例１日にコンビニに来客の数１ヶ月に起こ地震の数１年に倒産す企業の数歴史的には「馬に蹴らて死亡す兵士の数」いったのにポアソン分布がよく当てはりした 07 代表的な確率分布 11

12.

ポアソン分布ポアソン分布｜Poisson distribution 𝜆𝑥 𝑒 −𝜆 𝑃 𝑋=𝑥 = 𝑥! 関数パラメータ 𝜆 𝑒 = .718 … （ネイピア数）さっきの 𝜋 みたいな特殊な定数も一定時間に起こ回数の期待略記 𝑃𝑜𝑖𝑠(𝜆) 平均値 𝜆 分散 𝜆 の分が同じいう特徴をつをの的な = はを ( , , ) の率なのでではり ▌パラメータを変えると様々な形の関数が書ける 𝑃𝑜𝑖𝑠(0.5) 𝑃𝑜𝑖𝑠( ) 𝑃𝑜𝑖𝑠(10) 意味説明分布の分的な数のをのは分布のらりはりてくさいないですが確率数確率分布 07 代表的な確率分布 12

13.

ポアソン分布計算例１問 Aさんはスマホを半年に2回くらい落としてしまいます。では，Aさんがスマホを１年に１回も落とさない確率はいくつでしょうか。 𝜆𝑥 𝑒 −𝜆 𝑃 𝑋=𝑥 = 𝑥! ▌ ポアソン分布の性質時間のフレームを変えると 𝜆 が変わる「Aさが半年のうちにスマホを落す回数」の確率分布は𝑃𝑜𝑖𝑠( ) 「Aさが１年のうちにスマホを落す回数」の確率分布は𝑃𝑜𝑖𝑠(4) な 𝑃𝑜𝑖𝑠(4) に𝑥 = 0 を入 40 𝑒 −4 𝑃 𝑋 = 0|𝜆 = 4 = = 𝑒 −4 ≃ 0.0183 0! 07 代表的な確率分布 13

14.

ポアソン分布計算例２問 Bさんは500日の通学でイノシシに10回出くわしました。では，Bさんが100日でイノシシに１回でも出くわす確率はいくつでしょうか。 𝜆𝑥 𝑒 −𝜆 𝑃 𝑋=𝑥 = 𝑥! ▌ ポアソン分布の性質試行回数が多ければ「一定時間」は離散時間でも構わない「Bさが500回のうちにイノシシに出くわす回数」の確率分布は𝑃𝑜𝑖𝑠(10) 「Bさが100回のうちにイノシシに出くわす回数」の確率分布は𝑃𝑜𝑖𝑠( ) な 𝑃𝑜𝑖𝑠( ) に𝑥 = 0 を入 𝑃 𝑋 = 0|𝜆 = = 0 𝑒 −2 0! = 𝑒 −2 ≃ 0.135 1 − 0.135 = 0.865 ▌ 二項分布的に見ても良い 500日のうち10回出くわす遭遇確率は0.02 見「Bさが100回のうちにイノシシに出くわす回数」の確率分布は二項分布𝐵(100,0.0 ) な？ 07 代表的な確率分布 14

15.

二項分布とポアソン分布の関係 ▌ 二項分布とポアソン分布はたような形になることがある 𝐵(𝑛, 𝑝)において 𝑛 が大きく 𝑝 が小さい場，平均値が同じ 𝜆 = 𝑛𝑝 で 𝑃𝑜𝑖𝑠(𝜆) 似【前ページの例】(𝑋 ≥ 11はほぼ0なので省略) 𝐵(𝑛 = 100, 𝑝 = 0.0 ) 𝑃𝑜𝑖𝑠( ) 細かく見ると当然値は異なる例 𝑃(𝑋 = ) は二項分布では0.273 ポアソン分布では0.271 ▌ 結局どっちがいいの？統計的には，デ選択す方法がたくさ「デの当てはりが良い確率分布」をりすが，この授業の範囲外ですどちらも事象の発生メカニズムとして「正解」ではないので，お好きな方を選べ ※どちらのカニズム今回の例に対して「正解ではないが， 07 代表的な確率分布悪くない」いうり OK です 15

16.

幾何分布ベルヌーイ試行を別の見方で 𝑛 回中何回成功したか二項分布初めて成功するまでに何回かかったか幾何分布ちなみに「𝑛 回成功すでに何回かかったか」の確率分布は負の二項分布ていす ▌幾何分布に合う事象の例当たでくじを何回引いたか格すで何回受験したか 07 代表的な確率分布何日後に交通事故にったか 16

17.

幾何分布｜geometric distribution 幾何分布関数パラメータ 𝑃 𝑋 = 𝑥 = 1 − 𝑝 𝑥−1 𝑝 𝑝 成功確率略記 𝐺𝑒(𝑝) 1 𝑝 1−𝑝 𝑝2 平均値分散 ▌ 無記憶性を持つ「そ以前に何回失敗した」いう情報がってなくて次に当たりが来での回数の確率はわらない 10回連続で表が出たら今度こそ裏が出る …なんてことはない 10回連続で表が出た裏が出での回数は 𝐺𝑒(0.5) ギャンブラーの誤謬 ▌パラメータを変えると様々な形の関数が書ける 𝐺𝑒(0.5) 𝐺𝑒(0. ) 07 代表的な確率分布 𝐺𝑒(0.01) 17

18.

連続確率分布 07 代表的な確率分布 18

19.

正規分布左右対称の山アブ ▌たぶん最も重要な確率分布ム・ド・モアブル(1667-1754) 正規分布を見つけたさ人 Wikipediaより ▌なぜかいろいろな場面で登場する人間の身長や重などの身的・心理的特徴果物の重さ工場で作った部品の重さ・長さ ▌左右対称の山確率数の発生カニズムはかくだいたい左右対称と思われる場合に当てはめることが多い辺が多くてから離ほど確率密度が小さくな 07 代表的な確率分布 19

20.

, , = (1, , 3) 正規分布｜Normal distribution 正規分布関数パラメータ 𝑓 𝑋=𝑥 = 略記 , , 𝜋𝜎 2 𝑥−𝜇 2 = (−0.5, 1, 1)2 𝜎 (𝑥) = 𝑒 𝑥 𝜇 𝜎2 1 = 0 のきの ( ) の分の数は同じでがな 𝑁(𝜇, 𝜎 2 ) 平均値 𝜇 分散 𝜎2 本のを = の的なを ( , , ) の確率数確率分布 ▌ パラメータを変えると様々な形の関数が書ける 𝑁 150,82 𝑁 170,82 𝜇 が変わると平行移動 𝑁 170,1 2 𝜎 2 が変わると広がりが変わる 07 代表的な確率分布 20

21.

正規分布とはいえ計算は結構めんどくさい ▌連続確率変数では「ある値を取る確率」は計算しない（できない） × ある農園で収穫されたみかんの重さは正規分布 𝑁(100, 102) になることがわかっています。収穫したみかんのうちちょうど100gであるものは何％でしょうか。 ▌代わりに区間で確率を考える ○ ある農園で収穫されたみかんの重さは正規分布 𝑁(100, 102) になることがわかっています。収穫したみかんのうち90gから110gの間のものは何％でしょうか。 𝑓 𝑋=𝑥 = 1 𝜋𝜎 2 𝑥−𝜇 2 − 𝜎2 𝑓 𝑋=𝑥 = 110 絶対積分するじゃん今はコンピュが発達していのでさほど難しくは無いですが昔は結構致命的な問題ったのです න 90 07 代表的な確率分布 1 𝜋 × 102 1 𝜋 × 102 𝑥 − 100 2 − × 102 𝑥 − 100 2 − 𝑑𝑥 × 102 21

22.

正規分布正規分布の性質 ▌平均値 𝜇 と標準偏差 𝜎 に関しての性質 𝜇 から 𝜇 𝑁(170, 82 )におけ 170から178の区間の確率 𝜎 の区間の確率は𝜇 と 𝜎 の値に関わらず同じである 𝑁(0, 12 )におけ 0から1の区間の確率グレーの部分の面積がすべて同じなのです 07 代表的な確率分布 𝑁(50, 102 )におけ 50から60の区間の確率見た目に騙されないように縦軸・横軸の目盛りに注意！ 22

23.

正規分布もっというと 𝑑, 𝑒 の値が何であっても 𝜇 𝑑𝜎 から 𝜇 𝑒𝜎 の区間の確率は 𝜇 と 𝜎 の値に関わらず同じである 𝑁(170, 82 ) 𝑁(0, 12 ) 𝑁(50, 102 ) 濃いグレーの面積 𝜇 − 𝜎 から 𝜇 𝜎 162から178の区間 -1から1の区間 40から60の区間薄いグレーの面積 𝜇 − 𝜎 から 𝜇 𝜎 154から186の区間 -2から2の区間 30から70の区間 07 代表的な確率分布およそ 0.683 およそ 0.954 23

24.

つまり正規分布における確率は正規分布 𝜇 や 𝜎 が何でって ▌「平均値から標準偏差いくつ分の区間の確率は？」だけ考えたら良い例正規分布 𝑁(38, 6.42 )における31.6から41.4の区間の面積は？この正規分布において31.6は 𝜇 − 𝜎 で41.4は 𝜇 任意の正規分布における𝜇 − 𝜎 から𝜇 0.5𝜎 なので 0.5𝜎 の区間の面積同じ 𝑁(170, 82 )におけ 162から174の区間の面積で同じ 𝑁(50, 102 )におけ 40から55の区間の面積で同じ何でいいからなにか計算しやすい正規分布で計算したって良い 𝑁(38, 6.42 ) 「計算したって良い」書いていすが，実際にはどな正規分布を代わりに持ってきて計算は割と面倒です（結局積分が）そこで特定の正規分布に関してあらゆる幅の区間の面積を全部計算しておきました（昔のらい人が） 07 代表的な確率分布 24

25.

正規分布特定の正規分布とは Standard normal distribution ▌標準正規分布 𝑁(0, 12 ) のことです。 𝑥 の確率分布，使う数によってスケルがなので面倒ですが，標準化得点 𝑧 の確率分布であれば変数のスケールによらないので常に同じ分布を使すある変数 𝑥 が正規分布 𝑁(𝜇, 𝜎 2 )に従うとき， 𝑥−𝜇 平均 𝜇，標準偏差 𝜎 で標準化した値𝑧 = は標準正規分布 𝑁(0,12 ) に従う 𝜎 ▌確率分布を標準化すると標準化 𝑁(170, 82 ) 標準化 𝑁(0, 12 ) 07 代表的な確率分布 𝑁(50, 102 ) 25

26.

正規分布標準正規分布の値 ▌標準化得点なので，そのまま平均値から標準偏差いくつ分高い／低いかを表すことになる ▌標準正規分布における区間の面積はあらゆる正規分布の「平均値±標準偏差いくつ分」の区間の面積と同じ例標準正規分布における0から1.3の区間の面積は任意の正規分布𝑁(𝜇, 𝜎 2 ) における𝜇 から𝜇 1.3𝜎の区間の面積と同じいうこで標準正規分布に関してあらゆる幅の区間の面積を全部計算しておきました（昔のらい人が） 07 代表的な確率分布現代ではコンピュで簡単に計算出来のですが，標準正規分布を用いた確率の計算は仮説検定のところとも多少関係するので計算方法を理解してもらいたいのです。 26

27.

正規分布標準正規分布表 ▌標準正規分布 𝑁(0, 12 )におけるあらゆる区間の面積（確率）を計算した表大抵の統計学のテキストの後ろについていすいは検索したらすぐ見つかりす確率や相係数のように絶対に1を超ない（小数のみの）にしては頭の0を省略して表記するこがよくりす例標準正規分布における1.01以上の全区間の面積（＝任意の正規分布𝑁(𝜇, 𝜎 2 ) における𝜇 1.01𝜎以上の全区間の面積）が知りたい場合赤い丸に対応する.1562=およそ15.62%となる 07 代表的な確率分布 27

28.

正規分布標準正規分布表による計算例確率変数 𝑋 が正規分布 𝑁 170,82 に従うとき身長の平均値が170，分散が82 と仮定した場合の身長が180cm以上の人の割合を計算するイメージで 𝑥 が180以上になる確率は？ 1. まずは知りたい確率を明確にする今回は正規分布 𝑁 170,82 におけ 𝑃(𝑋 ≥ 180) を求この段階で図にしておくとたぶんわかりやすい【ポイント】 • この段階ではさほど厳でなくても良いこんな感じでOK • ただし「範囲の端が平均値より上か下か」だけは明確に 07 代表的な確率分布 28

29.

標準正規分布表による計算正規分布例確率変数 𝑋 が正規分布 𝑁 170,82 に従うとき身長の平均値が170，分散が82 と仮定した場合の身長が180cm以上の人の割合を計算するイメージで 𝑥 が180以上になる確率は？ 2. 標準化する 𝑋 の分布が 𝑁 170,82 前ページの図と対応しているので見比べてくださいいうこは 𝑋−170 = 𝑍 の分布が 𝑁 0, 1 8 になこれに合わせて先程の図も標準化する求たい面積が 𝑃 𝑋 ≥ 180 180を標準化したらよい上のに𝑋 = 180を代入す 180 − 170 = 1. 5 8 求めたい確率は𝑁 0, 1 の 𝑃 𝑍 ≥ 1. 5 と同じ 07 代表的な確率分布 29

30.

正規分布標準正規分布表による計算例確率変数 𝑋 が正規分布 𝑁 170,82 に従うとき 𝑥 が180以上になる確率は？身長の平均値が170，分散が82 と仮定した場合の身長が180cm以上の人の割合を計算するイメージで 3. 標準正規分布表から対応する値を探す 𝑃 𝑍 ≥ 1. 5 なので表によって見方が多少わりすが書いてある値は同じはずなのでどの表を使って問題り【答】 ※定期試験ではこの表渡しす .1056 (10.56%) 07 代表的な確率分布 30

31.

正規分布標準正規分布表のポイント ▌正規分布は左右対称です「範囲の端が平均値より上か下か」だけ明確にしておくと計算の仕方が見えやすくなるのですマイナスのときにはひっくり返しましょう例標準正規分布における-1から0の区間の面積（＝あらゆる正規分布𝑁(𝜇, 𝜎 2 ) における𝜇 − 𝜎 から𝜇の区間の面積）は標準正規分布における0から1の区間の面積に等しいプラスとマイナスにまたがるときには分割しましょう例標準正規分布における-0.5から1.5の区間の面積（＝あらゆる正規分布𝑁(𝜇, 𝜎 2 ) における𝜇 − 0.5𝜎 から𝜇 1.5𝜎の区間の面積）は標準正規分布における-0.5から0の区間の面積＋0から1.5の区間の面積に等しい「0以上」や「0以下」の確率は0.5です例標準正規分布における-1以上の面積（＝あらゆる正規分布𝑁(𝜇, 𝜎 2 ) における𝜇 − 𝜎 以上の面積）は標準正規分布における-1から0の区間の面積＋0以上の面積（=0.5）に等しいは実際に標準正規分布表でを探しながら慣 07 代表的な確率分布ていってくさい 31

32.

正規分布の性質正規分布 ▌ 形変換標準正規分布への換ではこの性質を利用していした 2 ) に従うき，確率数 𝑋 が正規分布 𝑁(𝜇, 𝜎 資料02 p. 16 換した数 𝑎𝑋 𝑏 は𝑁 𝑎𝜇 𝑏, 𝑎2 𝜎 2 に従う ▌再生性独立な2つの確率数 𝑋, 𝑌 がそぞその和 𝑋 𝜇𝑌 , 𝜎𝑋2 𝜎𝑌2 ) に従う正規分布 𝑁(𝜇𝑋 − 𝜇𝑌 , 𝜎𝑋2 𝜎𝑌2 ) に従う 𝑌 は正規分布 𝑁(𝜇𝑋 その差 𝑋 − 𝑌 例な正規分布 𝑁 𝜇𝑋 , 𝜎𝑋2 , 𝑁(𝜇𝑌 , 𝜎𝑌2 ) に従うき，分はどちらで和でに注（らつきの因が2つに増ていけ）国語のテストの得が 𝑁(60,102 )，数学のテストの得が 𝑁(40,52 ) った場， 2教科の計の分布は 𝑁 60 40,102 52 = 𝑁 100, 11.182 な 07 代表的な確率分布 32

33.

指数分布幾何分布の連続変数バージョンちなみに「𝑛 回発生すでにかかった時間」の確率分布はガンマ分布ていす（幾何分布 → 負の二項分布の係同じ） ▌ある事象が発生するまでにかかった時間 ▌事象自体はポアソン過程にそって発生すると仮定するある事象が発生する確率が時間によって変わらない ▌指数分布に合う事象の例電化製品が壊での時間病気になってから死亡すでの時間企業が上場すでの時間実際のころ，こらの時間は1日単で測定さこが多いので離数して扱ってよい＝幾何分布を当てはて良いは思いすが一般的には指数分布で扱うこが多いです。 07 代表的な確率分布 33

34.

指数分布｜exponential distribution 指数分布関数パラメータ 𝑓 𝑋 = 𝑥 = 𝜆𝑒 −𝜆𝑥 𝜆 略記一定時間に起こ回数の期待 𝐸𝑥𝑝(𝜆) 1 𝜆 1 𝜆2 平均値分散 ▌ 無記憶性を持つ「そ以前にど事象が発生すただしけ経過した」いう情報がってなくてでの時間の確率はわらないくで発生確率が「時間によってパソコンもスマホもいつか壊れますレポートはこまめに保存しましょうわらない」仮定での話つり厳密には「劣化しないスマホ」や「くじ引きで上場が」的な想定をしていいす ▌パラメータを変えると様々な形の関数が書ける 𝐸𝑥𝑝(3) 𝐸𝑥𝑝(1) 07 代表的な確率分布 𝐸𝑥𝑝(0. ) 34

35.

確率分布間の関係性 07 代表的な確率分布 35

36.

二項分布二項分布と正規分布の関係二項分布｜二項分布関数パラメータ = さっきの = C も確率 1 の関数なので当たり確率試行回数略記の ( , ) 平均値は分散 (1 を的なの = を ( , , ) すののは , = 170, 10 率なのでではり ) パラメータを変えると様々な形の関数が書ける ( = 5, = 0.7) ( = 10, = 0.5) ( = 50, 意味 = 0.3) 説明分布の分分布のらり的な数のをはりのはてくさいないですが正規分布っぽくみえませんか？ = 1 × 10 170 × 10 確率数確率分布代表的な確率分布【二項分布の正規】 𝑛 が十分に大きいき二項分布は試行回数 𝑛 が十分に大きいとき同じ平均値・分散をもつ正規分布によってすることが出来ます。 𝐵(𝑛, 𝑝) 𝜇 = 𝑛𝑝, 𝜎 2 = 𝑛𝑝(1 − 𝑝)の正規分布 𝑁 𝑛𝑝, 𝑛𝑝 1 − 𝑝 ほぼおなじ形になる！ 07 代表的な確率分布 …で？ 36

37.

二項分布で，なにがうれしいの？ ▌計算が簡単になります。例ある居酒屋では，来店した客のうち50%が名物メニューを注文します。このとき，ランダムに選んだ10名の客のうち4名以上が名物メニューを注文する確率は？二項分布 𝐵(𝑝, 𝑛) でちょうど𝑥回当た確率は（二項定理を思い出して） 𝑃 𝑋 = 𝑥 = 𝑛𝐶𝑥 𝑝 𝑥 1 − 𝑝 𝑛−𝑥 考え方①｜「４人注文」＋「５人注文」＋ … ＋「10人注文」考え方②｜１－（「０人注文」＋「１人注文」＋「２人注文」＋「３人注文」）どっちにしろ何回か計算が必要になるこの計算は高校でやったは ……もっと 𝑛 が増えたらどうしますか？サンプルサイズは多いほうが良いですからね 07 代表的な確率分布努力は報われるのでひたすら計算しますよ 37

38.

二項分布で，なにがうれしいの？ ▌計算が簡単になります。例ある居酒屋では，来店した客のうち50%が名物メニューを注文します。このとき，ランダムに選んだ1000名の客のうち490名以上が名物メニューを注文する確率は？考え方①｜「490人注文」＋「491人注文」＋ … ＋「1000人注文」統計的仮説検定や推定のところでこの考え方が重要になってきます 511回も計算する？考え方②｜１－（「０人注文」＋「１人注文」＋ … ＋「489人注文」）生意気言ってすみません 490回も計算する？正規を使ってもっと楽に計算しましょう 07 代表的な確率分布 38

39.

二項分布二項分布の正規 50%の客が注文するメニューを 1000人中490人以上が注文する確率は？左の二項分布の赤いところを全部足す or １からグレーのところを全部引くあるいは 𝐵(0.5, 1000) ≈ 𝑁(500, 50) 左の分布は正規分布に 𝑛 が十分に大きいき 𝐵(𝑛, 𝑝) 𝑁 𝑛𝑝, 𝑛𝑝 1 − 𝑝 ほぼおなじ形になる！ 07 代表的な確率分布てるので正規分布とみなして赤い部分の面積を求める 39

40.

二項分布二項分布の正規 50%の客が注文するメニューを 1000人中490人以上が注文する確率は？正規分布 𝑁(500, 50) において 𝑃(490 ≤ 𝑋) を求てげ標準正規分布𝑁(0,1)において 𝑃(490 ≤ 𝑋) のカッコ内の両辺を標準化す 𝑋 ∼ 𝑁(500, 50) 𝑍= 𝑋−500 250 𝑃 490 − 500 50 ≤ 𝑋 − 500 50 =𝑃 −10 50 ほぼ同じが出は ≤𝑍 おく 𝑍 ∼ 𝑁(0,1) 07 代表的な確率分布 𝑃 −10 ≤ 𝑍 を求めてあげればよい 250 40

41.

二項分布二項分布の正規 −10 ≒ −0.63なので 250 • 青い面積 𝑃(0 ≤ 𝑍) …正規分布の対称性より0.5 • 赤い面積 𝑃 −0.63 ≤ 𝑍 ≤ 0 …標準正規分布表を使う 0.5 - 0.2643 0.2357 Ａ．およそ73.57% 【ちなみに】全部足すと74.67% 𝑋 ∼ 𝑁(500, 50) 𝑍= 𝑋−500 250 近似なので全く同じ値にはなりません ※ここでは扱いが「連続性の補正」をすう少し近いになりすおく 𝑍 ∼ 𝑁(0,1) 07 代表的な確率分布 41

42.

（ちなみに）ポアソン分布も正規できますポアソン分布｜ポアソン分布関数 = = ! = .718 （ネイピア数）さっきのみたいな特殊な定数パラメータ一定時間に起こ回数の期待略記 ( ) 平均値確率の分が同じいう特徴をつ分散もをの = は的なを ( , , ) の関数なのですののは率なのでではりパラメータを変えると様々な形の関数が書ける (0.5) ( ) (10) 意味説明分布の分的な数のをのは分布のらりはりないですが正規分布っぽく , = 170, 10 みえませんか？ = てくさい確率 1 × 10 170 × 10 数確率分布代表的な確率分布【ポアソン分布の正規】 𝜆 が十分に大きいきポアソン分布は 𝜆 が十分に大きいとき同じ平均値・分散をもつ正規分布によってすることが出来ます。 𝑃𝑜𝑖𝑠(𝜆) 𝜇 = 𝜆, 𝜎 2 = 𝜆 の正規分布 𝑁 𝜆, 𝜆 ほぼおなじ形になる！ 07 代表的な確率分布後の流は同じなので省略 42

43.

確率分布間の関係まとめ参考： http://www.math.wm.edu/~leemis/chart/UDR/UDR.html ポアソン分布 𝜆大 𝑃𝑜𝑖𝑠(𝜆) 近似 𝑛大𝑝小近似成功回数ベルヌーイ分布 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝) 複数回試行失敗回数 𝐵(𝑛, 𝑝) 二項分布（対数正規分布）対数換標準正規分布 𝑁(𝜇, 𝜎 2 ) 𝑛大近似正規分布（t分布）指数分布 𝐺𝑒(𝑝) 𝐸𝑥𝑝(𝜆) 複数（負の二項分布） 07 代表的な確率分布 𝑁(0,1) 複数個の和幾何分布連続化標準化（カイ二乗分布）複数（ガンマ分布） 43

http://www.math.wm.edu/~leemis/chart/UDR/UDR.html

44.

当初の目的に立ち返ると ▌確率分布を関数で表せたらだいぶ楽になってきた次回はこの部分例母集団分布が 𝑁(𝜇, 𝜎 2 ) の場合標本分布は 𝑁(? , ? ) になる？母集団分布例標本分布𝑁(? , ? )を生み出す母集団分布は 𝑁(𝜇, 𝜎 2 )と考えるのが最も妥当母平均は 𝜇 と考えるのが妥当だろう！ 07 代表的な確率分布例母集団分布に確率分布を仮定した場標本分布確率分布になりす各標本の値と同じように標本統計量も確率変数だということです標本分布私達が実際に分かる範囲標本平均 𝑥ҧ 標本平均 𝑥ҧ を生み落とした標本分布は𝑁(? , ? )が最もしっくり来る 44