3.3K Views
November 17, 23
スライド概要
神戸大学経営学部で2022年度より担当している「経営統計」の講義資料「06_確率変数と確率分布」を公開用に調整したものです。
【更新履歴】
・2024/11/29:離散変数の期待値・分散の計算式のミスを修正しました (pp. 15-16)
神戸大学経営学研究科准教授 分寺杏介(ぶんじ・きょうすけ)です。 主に心理学的な測定・教育測定に関する研究を行っています。 講義資料や学会発表のスライドを公開していきます。 ※スライドに誤りを見つけた方は,炎上させずにこっそりお伝えいただけると幸いです。
経営統計 06 確率変数と確率分布 分寺 杏介 神戸大学 経営学部 [email protected] ※本スライドは,クリエイティブ・コモンズ 表示-非営利 4.0 国際 ライセンス(CC BY-NC 4.0)に従って利用が可能です。
前回のおさらい 1 サンプルサイズ 母集団からランダムな 𝑛 個のデータが得られた sample size 標本 データ A 1 ID B 性別 C D 身長 体重 E F 勉強時間 テストの得点 2 1 男 172 70 3.0 91 3 2 女 158 47 0.8 31 4 3 女 160 54 4.0 34 5 4 男 178 69 3.8 51 6 5 女 153 42 1.9 87 7 6 男 169 80 1.9 39 8 7 男 165 70 2.1 48 9 8 女 155 42 0.8 73 10 9 男 159 63 2.4 62 11 10 女 148 40 1.7 34 12 11 女 147 42 1.6 84 2 母集団の平均勉強時間の真の値はわからないものなので 手元のデータから推測するのです 母集団 平均勉強時間: ? 時間 平均勉強時間:2.5時間 得られたデータで 標本統計量を計算する 母数 parameter 3 標本統計量をもとに 母集団の値を推測する 06 確率変数と確率分布 母集団の平均勉強時間 ( に当てはまる値)はだいたい 2.3~2.7時間くらいでしょう 2
前回のおさらい 2 出現しうる標本の 1 母集団の分布を パターンが分かる 3 各標本で平均値 などを計算する なにか仮定する 標本の平均値 母集団分布 170.4 169.3 population distribution 4 標本の平均値の 分布を作れる ︙ ︙ ︙ ︙ 171.4 172.3 300万人だったら 標本分布 sampling distribution つまり「母集団分布が決まると,標本の統計量が とる値の分布:標本分布も一つに決まる」ということです だいたい10490通りくらい 06 確率変数と確率分布 3
前回のおさらい ▌ヒストグラムはデータの分布なので それができるなら苦労してないって 母集団のすべての値がわからないとヒストグラムは描けない 分布の形を説明するのが難しい ▌そしてヒストグラムは細かすぎる 母集団分布 「こういうときはこうなる」と一言でいえない 標本分布 140-141の高さが0.02で, 141-142の高さが0.024で, 164-164.1の高さが0.02で, 164.1-164.2の高さが0.023で, …(以下略) …(以下略) ▌ヒストグラムとよく似た何かを使って母集団分布を仮定しよう ヒストグラム よく似た形の線 a.k.a. 確率分布 かわりに ということで今回は「確率」のお話です 06 確率変数と確率分布 4
「確率」ってなんだっけ Wikipedia より 確率(かくりつ,英: probability)とは,偶然起こる現象に対する頻度(起こりやすさの指標)のことである。 ある目が出るという現象は偶然起こる を振ったときの出目は毎回わからない 出目についての説明変数が存在しない,ともいえる 出目の「頻度」は? 10回振ってみたら もちろんやるたびに変わります ⚀ ⚁ ⚂ ⚃ ⚄ ⚅ 頻度 1 2 2 3 2 0 割合 1/10 2/10 2/10 3/10 2/10 0/10 割合3/10で⚃が出た 06 確率変数と確率分布 この段階では ご存知1/6とは異なる値になっている 5
さいころを振りまくれ 1000回振ってみたら もちろんやるたびに変わります ⚀ ⚁ ⚂ ⚃ ⚄ ⚅ 頻度 162 184 154 166 162 172 割合 0.162 0.184 0.154 0.166 0.162 0.172 回数を増やすと ご存知 / = . …に近い値になっていく 割合166/1000で⚃が出た ∞回振ってみたら 極限をとる,ということです ⚀ ⚁ ⚂ ⚃ ⚄ ⚅ 回数 ∞ ∞ ∞ ∞ ∞ ∞ 確率 1/6 1/6 1/6 1/6 1/6 1/6 確率1/6で⚃が出た 06 確率変数と確率分布 無限に試行したとすれば ご存知 / = . …に収束する これからお話する(頻度主義)統計学の世界では 「頻度」の極限が確率 6
確率分布って? probability distribution ▌↓これのことです。 値 ⚀ ⚁ ⚂ ⚃ ⚄ ⚅ 確率 1/6 1/6 1/6 1/6 1/6 1/6 ▌どんな値がどんな確率で発生するかをまとめたもの ▌確率の基本 コルモゴロフの公理系と呼ばれます 1. ある事象が起こる確率は0から1の値 2. 何かしらの事象が起こる確率は1 合計が1という意味です 3. いくつかの互いに排反な事象のうちいずれかが起こる確率は, 各事象が起こる確率の和に等しい さいころを振ったときに「1かつ2」が出ることはありえない 「1か2が出る確率」は「1が出る確率」+「2が出る確率」 06 確率変数と確率分布 7
確率変数 random variable ちょっと硬い言い回しになりますが慣れてください ▌「変数」=「変わりうるもの」または「未知のもの」 1次関数 𝑓 𝑥 = 2𝑥 − 1 変数 𝑥 に入る値は特に決まっていない(何が入っても良い) 変数 𝑥 についての関数 「さいころを振ったときに出る目」 変数 𝑥 に入る値はまだ決まっていない(何が入るかわからない) ▌「確率変数」 観測される値が確率的に決定する変数のこと 確率変数 には 「さいころを振ったとき に出る目」 値 ⚀ ⚁ ⚂ ⚃ ⚄ ⚅ という値が 確率 1/6 1/6 1/6 1/6 06 確率変数と確率分布 1/6 1/6 という確率で観測される 8
ここまでを整理 & 記号の導入 ▌確率=ランダムな現象について特定の値が出る頻度(割合) 𝑥 という事象が起こる確率を 𝑃(𝑥) と表します ▌確率変数=実際に観測される値が確率的に決まる変数 確率変数は大文字を使って 𝑋 と表します 例 さいころの出目 (𝑋) 値 ⚀ ⚁ ⚂ ⚃ ⚄ ⚅ 確率 1/6 1/6 1/6 1/6 1/6 1/6 𝑥 1 2 3 4 5 6 𝑃(𝑋 = 𝑥) 1/6 1/6 1/6 1/6 1/6 06 確率変数と確率分布 1/6 これは確率分布 𝑃 𝑋=1 =𝑃 𝑋=2 =⋯= 1 6 9
改めてデータについて考える 資料04 ▌本当はデータの背後には複雑なメカニズムがある ( )な 背後には色々な要因があり ( )な 「ばらつき(分 「個 「ばらつき(分 それらが影響することで 基本的に ( )」で考えるのか? )な 「ばらつき(分 は 個 ( 国 の の い い の の い 生 の い の い の い 個 のある が に関 い い きな べ が き の までの (ばらつきが生じる) 人間の平均 の 」があるならば ての要因が えるのでし う ー ン ーム) の の さんい 実際にはこんなに ン ルでは いですが,イメー として考えてみます のばらつき 「 に関 をも が 値が決まる )」で考えるのか? ン ルに考えてみる 」の要因はさま ま かく分 すると )」で考えるのか? あまり しない . きな べ の い 回 分 ただし全ての要因を知ることはできない 回 分 どのように影響を与えるかもわからない ・ 生 ・ の など あら る要 に関 なく 回 分 06 確率変数と確率分布 しているのか? 10
ええい,ままよ! 部ひっくるめて「 ▌ のおぼしめし」とでもしよう ( )な 背後には色々な要因があり ( )な 「ばらつき(分 「個 基本的に ( あなたの体重は )な 「ばらつき(分 国 の の い い の の い 生 の の さんい きな べ い の い の い のある 59.7 58.2 52.3 75.8 49.9 54.1 が き の までの 個 実際にはこんなに ン ルでは いですが,イメー として考えてみます 完全ランダムに い い 個 人間の平均 の 」があるならば ての要因が えるのでし う ー ン ーム) の に関 をも が ボタンを押すと のばらつき ( は )」で考えるのか? ン ルに考えてみる 」の要因はさま ま 「 )」で考えるのか? それらが影響することで )」で考えるのか? かく分 すると 「ばらつき(分 あまり しない 値が決定するマシンがある . きな べ の い ****** kg です 回 分 ただし全ての要因を知ることはできない …と考えてみる 回 分 どのように影響を与えるかもわからない このマ ンが「どんな確率でどんな値を出すか」 =母集団の確率分布(母集団分布) ・ 生 ・ の など あら る要 に関 なく が 回 分 06 確率変数と確率分布 に関 しているのか? 11
データを「確率変数」とみなす ▌一つ一つのデータは確率変数の実現値 母集団 𝑥 3 家族の人数 (𝑋) 一つ一つの値が ∞人のデータから 3 完全ランダムに 4 1人選んだら 5 4 3 3 6 ランダムに一つ抽出したときの確率も (∞) と同じ 母集団の確率分布に従って実際の値が決まる 𝑥 1 2 3 4 5 6 … 𝑃(𝑋 = 𝑥) 0.002 0.03 0.45 0.32 0.14 0.05 … ∞面 のさいころを振って 出た目に対応する人の値を取り出すと データを確率変数として考えることで 確率論に基づいて統計的推測ができる 2 ︙ に沿って確率的に決まる 例 【統計的仮説検定】 母集団分布が◯◯のときに身長の標本平均が■■以上になる確率は▲▲% →母集団分布が◯◯とは考えにくい! 06 確率変数と確率分布 12
変数の種類 的変数は,これらとはまた別の形で確率変数として われるのですが,この授業では取り上げません。 ▌タイ によって確率変数としての扱い方が変わります 資料01 p. 35 変数と 変数 変数 変数 数も 数もとりうる 的変数 数しかとらない 的変数 クラスの人数 かい値はとらない 無限に かくできる 身長 では「 」のように 数 までしか 表 されないが,これは の 度の 。 もし な身長計なら無限に かく れるはず 取りうる値の数が の分 では い変数については, 変数として うことも 分 さ い 学で「 変数」のまま われる事が 「回数」や「 数」な の ト の かも いのは データの ま は簡単な方から ていきまし う 06 確率変数と確率分布 13
確率変数 ▌取りうる値が整数のみの確率変数 例 家族の人数 (𝑋) 𝑥 1 2 3 4 5 6 … 𝑃(𝑋 = 𝑥) 0.002 0.03 0.45 0.32 0.14 0.05 … 変数との対比のために,無理やり図に表してみると ど らも 確率分布 . . . . . . … 変数的な見方をすると 整数以外が出る確率は0 ということになる 06 確率変数と確率分布 14
確率変数の期待値と分 ▌期待値=平均値 データから完 ランダムに一人取り出したときの期待値 例 データにおける家族の人数の平均値は? (10人分) 𝑥 3 3 4 3 1 3+3+4+3+4+4+5+3+2+3 10 同 値をまとめると 1 2×1 + 3×5 + 4×3 + 5×1 10 4 3 2× 1 5 3 1 + 3× + 4× + 5× 10 10 10 10 シグマ記号でまとめると 2 3 1 2 3 4 5 6 … 度数 0 1 5 3 1 0 … 𝑥 1 2 3 4 5 6 … 𝑓𝑥 0 1/10 5/10 3/10 1/10 0 … 先に割合になおすと 4 5 𝑥 𝑓𝑥 はデータ全 のうち X = 𝑥 の人の割合 𝑥ҧ = 𝑥 × 𝑓𝑥 𝑥∈𝑋 06 確率変数と確率分布 15
確率変数の期待値と分 例 データにおける家族の人数の分 (10人分) 𝑥 3 は? 𝑥 の代わりに 𝑥 − 𝑥ҧ 2 の平均値をとれば分 になる 3 𝑥 4 𝑥 − 𝑥ҧ 2 3 𝑓𝑥 1 2 4 0 1/10 1.96 × 5/10 3/10 平均値 … 1/10 0 … 𝑓𝑥 はデータ全 のうち X = 𝑥 の人の割合 シグマ記号でまとめると 3 3 6 1 5 3 1 + 0.16 × + 0.36 × + 2.56 × 10 10 10 10 5 2 5 5.76 1.96 0.16 0.36 2.56 6.76 … 4 4 3 𝑣𝑥 = 𝑥 − 𝑥ҧ 2 × 𝑓𝑥 𝑥∈𝑋 3.4 06 確率変数と確率分布 16
確率変数の期待値と分 ▌期待値=平均値 母集団から完 ランダムに一人取り出したときの期待値 例 母集団における家族の人数の平均値は? 𝑥 𝑃(𝑋 = 𝑥) 1 0.002 2 0.03 3 0.45 . 4 5 0.32 0.14 6 … 0.05 … 同 ように考えたら 𝐸 𝑋 = 𝑥 × 𝑃(𝑋 = 𝑥) 𝑥∈𝑋 全事象について,値と確率の積を足しあげる . . . . . ▲ 確率変数では,期待値を𝐸[𝑋] と表します Expected value ▌分 例 母集団における家族の人数の分 同 ように考えたら は? 𝑉 𝑋 = 𝐸 𝑥 − 𝜇 2 = 𝑥 − 𝜇 2 × 𝑃(𝑋 = 𝑥) 母平均 𝜇 との偏差の二乗の期待値 𝑥∈𝑋 ▲ 確率変数では,分 をV[𝑋] と表します Variance 06 確率変数と確率分布 17
変数の種類 的変数は,これらとはまた別の形で確率変数として われるのですが,この授業では取り上げません。 ▌タイ によって確率変数としての扱い方が変わります 資料01 p. 35 変数と 変数 変数 変数 数も 数もとりうる 的変数 数しかとらない 的変数 クラスの人数 かい値はとらない 無限に かくできる 身長 では「 」のように 数 までしか 表 されないが,これは の 度の 。 もし な身長計なら無限に かく れるはず 取りうる値の数が の分 では い変数については, 変数として うことも 分 さ い 学で「 変数」のまま われる事が 「回数」や「 数」な の ト の かも いのは データの いて複雑な方を ていきまし う 06 確率変数と確率分布 18
確率変数 ▌整数以外もとりうる確率変数 例 (𝑋) 𝑥 ・・・ 𝑃(𝑋 = 𝑥) ・・・ 𝑥 𝑃(𝑋 = 𝑥) 𝑥 𝑃(𝑋 = 𝑥) 169.8 169.9 170.0 170.1 170.2 ? ? 169.75 169.76 ・・・ ? … ? ? ? … 169.80 169.81 ・・・ 169.795 169.796 ・・・ ? … ・・・ ? … ? … 169.84 ・・・ … 169.800 169.801 ? ? … 169.804 ・・・ … 最終的には 𝑃 𝑋 = 𝑥 = 0 になってしまう 06 確率変数と確率分布 19
変数における「確率」? つまりこのような母集団から一人ラ ダムに選んで身長を も ろんゼロ ゼロにしないと「全部足したら1」を満たせなくなる ▌じゃあ確率分布が表している値は何なのさ . . ? . . っと考え方を変えてみます 問 したとき . か 右のような確率分布からランダムに一つ値を取り出したとき, その値がちょうど170になる確率は? (厳密に書けば) . …になる確率は? 確率ではない 問 確率分布 右のような確率分布からランダムに一つ値を取り出したとき, その値が170から180の間になる確率は? これならゼロじゃない 確率を「区間」で 考えていきます 06 確率変数と確率分布 20
確率を区間でとらえる 右のような確率分布からランダムに一つ値を取り出したとき, その値が170から180の間になる確率は? 問 右のような確率分布からランダムに一つ値を取り出したとき, その値が0から500の間になる確率は? 計算せ ともほぼ100% およそ35.0% 確率変数 𝑋 が身長なら . か . . 確率ではない か 問 変数の確率分布は区間で確率を表したものである 確率ではない ▌ . . . . . . . この赤い部分が この赤い部分が 35.0%を表している 100%を表している 06 確率変数と確率分布 21
確率は面積だ p. 7 ▌確率の基本2 = すべての 象の確率を合計すると1 (=100%)になる 確率ではない か . . すべての値の出現確率を合計すると1になる . = この赤い部分の面積が1になると考える . …すると確率分布の高さはどうなる? . 確率ではない か . とりあえず かいことを無視して三角形で近似すると 底辺の長さ50 (145から195) くらいで割と近い形になるので . . 50 × . 高さ ÷2=1 50 高さ は 0.04 くらい にはこの面積を うために積分を使います . 06 確率変数と確率分布 22
結局その「高さ」ってのは何なんだ 確率ではない か ▌とりあえ 「確率」そのものではないことは確か . p. 20 で見たように . 「ちょう …が出る確率が0.04」ということではない Probability density 「確率」ではなく 「確率密度」 と呼ぶことにします . 0.04 . 具 的に何を表しているのか,と言われると 面積の合計が1になるようにいい感じに調整された値としか言えません . うので1を超えても問題ない 確率密度 ▌ 「確率」とは 𝑥 の値を1/100(cm→m)に変換した場合 . . . . . . . . 確率密度の最 はもとの100倍=4くらいになります 06 確率変数と確率分布 23
確率変数の期待値と分 ▌期待値=平均値 例 母集団における 母集団から完 の平均値は? 積分しまし う いい感じの高さの 方形で近似する 10ごとに区切る . . . . . . 確率密度 . 確率密度 確率密度 確率分布 ランダムに一人取り出したときの期待値 . . . . . . . . 方形の和が 明らかに1にならない ▼ 高さを調整します 06 確率変数と確率分布 24
確率変数の期待値と分 ▌期待値=平均値 例 母集団における 母集団から完 ランダムに一人取り出したときの期待値 の平均値は? 積分しまし う 確率密度 . . . が になるように . 「確率」にするため 和が1になるように 高さを調整 . ヒストグラムからなら 平均値は計算しやすい 区間内の値を 𝑥 -140 -150 -160 -170 -180 -190 -200 中央値 135 145 155 165 175 185 195 𝑃(𝑋) 0.003 0.020 0.128 0.331 0.368 0.014 0.001 て「中央値」に置き換えて平均をとればよい 135 × 0.003 + 145 + 0.020 + ⋯ + (195 × 0.001) 06 確率変数と確率分布 25
確率変数の期待値と分 ▌期待値=平均値 例 母集団における 母集団から完 ランダムに一人取り出したときの期待値 の平均値は? 区切り幅10 積分しまし う 区切り幅5 区切り幅1 . が になるように が になるように が になるように . . . . . . . . . 区切り幅を小さくするほど もとの確率分布に近づく 06 確率変数と確率分布 26
確率変数の期待値と分 ▌期待値=平均値 例 母集団における 区切り幅 限小 母集団から完 ランダムに一人取り出したときの期待値 の平均値は? 積分しまし う ※確率を 𝑃(𝑋 = 𝑥) で表したように確率密度は 𝑓(𝑋 = 𝑥) で表す . 確率変数の期待値を 𝐸 𝑋 = 𝑥𝑃(𝑋 = 𝑥) で表したように . 𝑥∈𝑋 ∞ . . 確率変数の期待値を 𝐸 𝑋 = න 𝑥𝑓 𝑋 = 𝑥 𝑑𝑥 で表す . −∞ つまり基本的な考え方は同 値と頻度(確率・確率密度)の積を ▌分 象について足し合わせる ∞ 同 ように考えたら 𝑉 𝑋 = 𝐸 𝑥 − 𝜇 2 = න 𝑥 − 𝜇 2 𝑓 𝑋 = 𝑥 𝑑𝑥 −∞ 06 確率変数と確率分布 母平均 𝜇 との偏差の二乗の期待値 27
いったん話を戻すと ▌統計的推測に 要な情報は母集団分布と標本分布の関 資料05 p. 23 母集団分布が○○の場合 標本分布は△△になる . . 母集団分布 . . . . . . . . 資料05 pp. 26-27 ? 標本分布 標本的には標本分布が△△だと最もしっくり来るので 母集団分布は○○と考えるのが妥当だろう 06 確率変数と確率分布 28
母集団分布は何でもいいのか? ▌母集団分布の可能 資料05 p. 23 は 限大 母集団分布が○○の場合 標本分布は△△になる . 母集団分布 . この○○をどうやって説明する? . . . x=150では0.004で,x=151では0.006で,… 確率変数ですらほぼ 理 関数による表現を考えます 06 確率変数と確率分布 29
関数:簡単な ▌高 で った(は の)二次関数 x=0では-3で,x=1では0で,x=2では5で… 説明 𝑓 𝑥 = 𝑥 2 + 2𝑥 − 3 すべての線はどうにかして 関数によって表すことができる 06 確率変数と確率分布 30
母集団分布も関数で表してみる ▌とはいえ▼のような形を簡単な関数では表せないだろう . . . . ちっちゃい事は 気にするな . . . . . . 一応フーリエ級数展開を使えば これも関数として表せると思いますが 複雑すぎて いにくくなってしまいます 𝑥 − 170 2 𝑓 𝑋=𝑥 = exp − 2 2 × 102 2𝜋 × 10 1 扱いやすい関数の形で 近似してあげる 06 確率変数と確率分布 31
すべての線は ▌大きく分けると2つの要 で形が決まっている 例|二次関数 曲線 𝑓 𝑥 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 𝑎, 𝑏, 𝑐 = (1, 2, −3) 𝑎, 𝑏, 𝑐 = (−0.5, 1, 1) とりあえ 「式中のパラメータの値が変わることでいろんな線が作れる」 ということは最低限理解しておいてください パラメータ 意味 𝑎 曲率 𝑏 置 𝑐 切片 説明 曲がり具合と凸方向を決める 曲線の頂 の 置を動かす 𝑥 = 0 のときの 𝑓(𝑥) の値 大抵の線は以下の2つの情報を組み合わせて作られる 関数形 ▲ 関数形は同 で パラメータが異なる2本の線 線の形状を決めるもの 𝑓 𝑥 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 06 確率変数と確率分布 パラメータ 具 的な線を決めるもの (𝑎, 𝑏, 𝑐) 32
さっきの近似曲線も 確率密度 の 関数 なので 大抵の線は以下の2つの情報を組み合わせて作られる Probability density function 関数形 パラメータ 確率密度関数 線の形状を決めるもの 𝑓 𝑥 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 具 的な線を決めるもの (𝑎, 𝑏, 𝑐) と呼ばれます 𝜋 は円周率なので パラメータではありません 【正規分布】 Normal Distribution 例 p. 31の近似曲線は . . 𝑥−𝜇 2 𝑓 𝑥 = exp − 2𝜎 2 2𝜋𝜎 2 1 パラメータ 意味 説明 𝜇 ミュー 平均 分布の平均値 𝜎 2 シグマ 分 分布の らばり具合 具 的な関数の式を覚える必要はとりあえずないですが パラメータの意味は必ず覚えてください 06 確率変数と確率分布 . . . 𝜇, 𝜎 2 = 170, 102 𝑥 − 170 2 𝑓 𝑥 = exp − 2 × 102 2𝜋 × 102 1 33
パラメータが変わると . . 平均値 𝜇 が変わると 分布は平行移 する 分 𝜎 2 が変わると 分布の広がりが変わる . . 𝑁(180, 102 ) . . 𝑁(170, 152 ) 𝑁(170, 102 ) . . . . . . 正規分布では パラメータを変えると 様々な左右対称の山が 描ける 06 確率変数と確率分布 . . . 34
関数のメリット:簡単な ▌高 で った(は の)二次関数 二次関数𝑓 𝑥 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐の場合 −𝑏± 𝑏2 −4𝑎𝑐 𝑓 𝑥 = 0になるのは𝑥 = のとき 2𝑎 −𝑏 ± 𝑏 2 − 4𝑎𝑐 2𝑎 同じ関数形ならばどんなパラメータの組でも 成立するような理論を組み立てられるようになる 06 確率変数と確率分布 35
関数のメリット:確率分布でも ▌関数ベースで考えてあげると 𝑥−𝜇 2 母集団分布が 𝑓 𝑥 = exp − の場合 2𝜎 2 2𝜋𝜎 2 𝜎2 標本平均の標本分布は平均 𝜇,分 になる 𝑛 1 . . . . . . . . . . 詳しくは次回説明します 同じ関数形ならばどんなパラメータの組でも 成立するような理論を組み立てられるようになる 06 確率変数と確率分布 36
母集団分布と標本分布がつながった ▌矢印をひっくり返せば p. 28 𝑥−𝜇 2 母集団分布が 𝑓 𝑥 = exp − の場合 2𝜎 2 2𝜋𝜎 2 𝜎2 標本平均の標本分布は平均 𝜇,分 になる 𝑛 1 . . . . . . . . . . 詳しくは次回説明します 標本的には標本分布の平均値 𝜇 が170だと最もしっくり来るので 母集団分布の平均値 𝜇 は170と考えるのが妥当だろう 06 確率変数と確率分布 37
確率分布を関数で表そう …といってもなんでもいいわけじゃない 二次関数 ▌確率のルール(公理)を満たしている 要がある さを適当に調 した 負の値をとらない関数でないといけない 「和が1」は ら良いので気にしなくてOKです ▌それなりに ン ルである パラメータの数はせい 数 要がある い2, 3個にしておきたい 的に扱いやすい関数でないといけない 複雑な関数 . . . . . ▌そもそも確率分布は何かしらの現象を表したもの 実質的な意味を持った関数でないといけない そんな関数はそこまで多くない(と言われている) 06 確率変数と確率分布 次回は「そんな関数」の を ます 38