33.2K Views
February 18, 23
スライド概要
2022年度統計学IIの講義資料です。
好きな色は緑です。
統計学 II-3 ・推測統計の導入 ・標本抽出 ・点推定 ・標本分布 ・区間推定 ・仮説検定 https://logics-of-blue.com/
本資料について 本資料の成り立ち 馬場が担当する学部1年生向け統計学IIの講義資料抜粋 統計学を初めて学ぶ、文系の学生が受講する想定 本資料の取り扱い あくまでも、本来の講義資料の抜粋なので注意 (計算演習・講義内クイズ・前回講義の復習 口頭での説明内容等は省略) SNSなどでスライドのスクショを張り付けるのは、 避けてほしい (文脈がわからないと、誤った理解を促すため) 2
本資料について 本資料の使い方 想定①:講義の受講者が復習に利用する 想定②:未受講者が統計学入門資料として利用する ※想定②の場合は、下記参考文献も参照すること 参考文献 馬場真哉,2022,翔泳社 『Pythonで学ぶあたらしい統計学の教科書 第2版』 倉田博史・星野崇宏,2009,新世社 『入門統計解析』 鈴木武・山田作太郎,1996,内田老鶴圃 『数理統計学』 3
本資料の範囲 10.統計的仮説検定の導入 11.統計的仮説検定の解釈 12.母平均に関する検定1 13.母平均に関する検定2 14.独立性の検定 15.期末テスト
統計学 II 第10回:統計的仮説検定の導入
内容 1.二項検定の初歩 2.母平均に関する𝒕検定の初歩 3.統計的仮説検定を利用する注意点 6
二項検定の初歩 7
内容 1.二項検定の初歩 2.二項分布 3.二項検定 8
内容 1.二項検定の初歩 2.二項分布 3.二項検定 9
二項検定の初歩 統計的仮説検定とは(ざっくり) ⚫ データを使って判断のサポートをする手法 (あくまでサポートするだけなので注意) ⚫ 確率の考え方を使うのが特徴 ⚫ 単に「仮説検定」や「検定」と呼ぶこともある ⚫ 統計的仮説検定にはたくさんの手法がある データや目的に合わせて手法を使い分ける 二項検定 統計的仮説検定の一種。母比率の検定と呼ぶこともある 問題設定がイメージしやすいので、最初に紹介する 色んな検定があるが、まずは二項検定を 10
二項検定の初歩 ここからの進め方 ちゃんとした用語の定義などは、後ほど説明 まずはざっくり検定の流れを説明 11
二項検定の初歩 ちょっと怪しい推論 SSR排出率が2%のガチャがある 10連ガチャを回しても、当たりキャラが出ない ↓ このガチャは当たりキャラが一人も入ってない。不正だ! ガチャで当たりが出ないことはよくあるよ 今回の事例 ガチャを回しても当たりが1回も出なかった →当たり率は2%とより小さいのではないだろうか? →「当たり率が2%より小さい」と言えるかどうか調べる 参考:ワンランク上を目指す人のためのPython実践活用ガイド(2022).技術評論社 第7章7-5節(馬場執筆箇所)
二項検定の初歩 帰無仮説・対立仮説 帰無仮説:ガチャの当たり率は2%と等しい ○○は××と等しい 対立仮説:ガチャの当たり率は2%より小さい ○○は××と異なる(大きい/小さい) 帰無仮説との矛盾の度合いを測ることで 自分の主張したいことを支持する 13
二項検定の初歩 有意差 意味の有る差 正直、かなりあいまい 「意味の有る差」ってなんだ 「意味の無い差」ってなんだ 14
二項検定の初歩 1%以上ずれてたら 有意差ありってことにしようぜ~ 10連しか回さなかったら、当たり0%になる 1連しか回さなかったら、0%はよくある そのやり方だと、回す数を減らすと 有意差が出やすくなりそうだ くっ…… 15
二項検定の初歩 じゃあ200連以上回して当たり0なら 有意差ありってことにしとこうぜ! 200連回して当たり0より、 2000連回して当たり1の方がひどくない? 1億連回して、当たり1でも有意差無しだと ちょっと違和感があるな くっ…… 16
二項検定の初歩 意外と難しい有意差の考え方 統計的仮説検定では確率を計算して判断をサポートする →「仮に○○だと想定したら」という仮定をおいて 確率を計算する 確率を計算しよう 1. 「当たり率が本当に2%だとしたら」という仮定を置く (他にもいろいろな仮定があるが、後述) 2. 実際の結果、あるいはそれより極端な結果が 発生する確率を計算する 17
クイズ 表が出る確率が2%のコインを 100回投げて、 表が1回も出ない確率は? 確率を計算しよう SSRの当たり率が2%のガチャを100回実行したとき、 当たりが1回も出ない確率は? ① 1%未満 ② 1~5% ③ 6~10% ④ 11~15%
クイズ(回答) 表が出る確率が2%のコインを 100回投げて、 表が1回も出ない確率は? 確率を計算しよう SSRの当たり率が2%のガチャを100回実行したとき、 当たりが1回も出ない確率は? ① 1%未満 ② 1~5% ③ 6~10% ④ 11~15% 100回程度当たらなくても仕方ない よくあること
クイズ(回答) 計算方法 当たりが出る確率が2%ということは、 はずれが出る確率は98%! 98%で起こることが100回連続で起こる確率を計算 0.98 × 0.98 × 0.98 ×… 0.98 × 0.98 0.98を100回掛け合わせる 答えはおよそ0.133なので13%ほど 20
クイズ(回答) 計算方法 当たりが出る確率が2%ということは、 はずれが出る確率は98%! 98%で起こることが100回連続で起こる確率を計算 スマホの電卓機能を使って 0.98の100乗を計算すると一瞬 0.98 × 0.98 × 0.98 ×… 0.98 × 0.98 (期末テストではスマホ利用不可) 0.98を100回掛け合わせる 答えはおよそ0.133なので13%ほど 21
二項検定の初歩 確率の閾値について SSRの当たり率が2%のガチャを100回実行したとき、 当たりが1回も出ない確率はおよそ13% とりあえずこの確率が5%未満なら 有意差ありってことにしとこうぜ(テキトー) 5%という数値には根拠がないが、 経験的に5%という数値が多く使われる この閾値を有意水準と呼ぶ 22
二項検定の初歩 確率の閾値について SSRの当たり率が2%のガチャを200回実行したとき、 当たりが1回も出ない確率はおよそ1.8% かなり低い確率じゃん じゃあ有意差ありってことにしとこうか なんか雑だが、このように判断することは しばしば行われているようだ 便利な判断基準だが、乱用には注意 23
二項検定の初歩 確率の閾値について SSRの当たり率が2%のガチャを200回実行したとき、 当たりが1回も出ない確率はおよそ1.8% 98%で起こることが200回連続で起こる確率を計算 0.98 × 0.98 × 0.98 ×… 0.98 × 0.98 0.98を200回掛け合わせる 答えはおよそ0.018なので1.8 %ほど 24
二項検定の初歩 ひとまずの結論 SSRの当たり率が2%のガチャを100回実行したとき、 当たりが1回も出ない確率はおよそ13% SSRの当たり率が2%のガチャを200回実行したとき、 当たりが1回も出ない確率はおよそ1.8% SSRの当たり率が2%だと想定したとき、 実際の結果、あるいはそれより極端な結果が 発生する確率が5%未満なら、 当たり率が2%とは違う(有意差あり)ってことにしておこう (この5%を有意水準と呼ぶ) (この5%という数値に根拠はない。1%などでもOK) (有意水準を1%にしたら、200回ガチャでも有意差無し)
内容 1.二項検定の初歩 2.二項分布 3.二項検定 26
二項分布 確率の計算と二項分布 前期で登場した二項分布を使って確率を計算する 二項分布とは 確率分布の1種。正規分布のようにパラメータを持っている →パラメータを変えることで、様々な確率分布を作れる 二項分布の確率質量関数 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 パラメータは𝑛と𝜃の2つ 27
二項分布 二項分布のパラメータ𝜃, 𝑛の意味 表が出る確率が𝜃であるコインを𝑛回投げた時、 𝑋回の表が出る確率 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 成功確率:𝜃 試行回数:𝑛 28
二項分布 二項分布に従う確率変数の期待値と分散(参考) 成功確率:𝜃 試行回数:𝑛 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 期待値 𝐸 𝑋 = 𝑛𝜃 分散 𝑉 𝑋 = 𝑛𝜃 1 − 𝜃 証明は少し難しいので省略 (興味のある学生は https://logics-of-blue.com/stats-calc-note/ )
二項分布 確率を計算しよう(復習) 1. 「当たり率が本当に2%だとしたら」という仮定を置く 2. 実際の結果、あるいはそれより極端な結果が 発生する確率を計算する 今までと全く同じ確率の計算を 二項分布を使ってもう一度行う 30
二項分布 今までの議論 SSR排出率が2%のガチャがある でも、当たりキャラが出ない! →「当たり率が2%より小さい」と言えるかどうか調べる 二項分布を使って議論 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 パラメータ𝜃が「当たり率」である →「パラメータ𝜃が0.02より小さいと言えるか」を調べる 二項検定はパラメータ𝜃が ある特定の値と異なるかどうかを調べる
二項分布 二項分布で確率計算 SSRの当たり率が2%のガチャを100回実行したとき、 当たりが1回も出ない確率はおよそ13% 数値を 代入 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 Bin 0 100,0.02 = 𝑛−𝑥 0 ∙ 1 − 0.02 C ∙ 0.02 100 0 100−0 = 13% 「パラメータ𝜃が0.02だ」と考えて確率を計算 → 𝜃 = 0.02を代入 ガチャを100回実行した → 𝑛 = 100を代入 1回も当たりが出なかった → 𝑋 = 0を代入 32
二項分布 二項分布で確率計算 SSRの当たり率が2%のガチャを200回実行したとき、 当たりが1回も出ない確率はおよそ1.8% 数値を 代入 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 Bin 0 200,0.02 = 𝑛−𝑥 0 ∙ 1 − 0.02 C ∙ 0.02 200 0 200−0 = 1.8% 「パラメータ𝜃が0.02だ」と考えて確率を計算 → 𝜃 = 0.02を代入 ガチャを200回実行した → 𝑛 = 200を代入 1回も当たりが出なかった → 𝑋 = 0を代入 33
内容 1.二項検定の初歩 2.二項分布 3.二項検定 34
二項検定 二項分布から見た二項検定 母集団分布を二項分布だと考える 二項分布からの単純ランダムサンプリングで 「当たり回数」というデータが得られると考える 二項検定は母集団分布のパラメータ𝜃が ある特定の値と異なると言えるかどうかを調べるための 手法だと言える 35
二項検定 とあるガチャを100回実行したとき…… 100回中、1回当たったよ! 100回中、 3回も当たったよ! 100回中、 1回も当たらない…… 母集団:知りたいと思っている集団全体 →今回の例では、無数のガチャ結果
二項検定 とあるガチャを100回実行したとき…… 1回も当たらない…… 標本:手に入れた一部のデータ →今回は1回も当たらなかったとする
二項検定 とあるガチャを100回実行したとき…… 3回当たった! たまたま 「たくさん当たる」 こともある
二項検定 とあるガチャを100回実行したとき…… 3回当たった! 無数のガチャ結果から ランダムに1回の結果を取得
二項検定 単純ランダムサンプリング 1回も当たらない…… 試行回数𝑛 = 100、 成功確率𝜃 = 0.02の 二項分布が母集団分布 母集団についての仮定+ 標本抽出の仮定を組み合わせたモデル 40
二項検定 確率を計算しよう 1. 「当たり率が本当に2%だとしたら」という仮定を置く さらに、母集団分布が二項分布であり、 そこから単純ランダムサンプリングで標本が得られた という仮定を置く 2. 実際の結果、あるいはそれより極端な結果が 発生する確率を計算する この確率を𝑝値と呼ぶ SSRの当たり率が2%のガチャを100回実行したとき、 当たりが1回も出ない確率はおよそ13% 𝑝値が有意水準(5%)以上なので差があるとは言えない →ガチャ不正の根拠を得ることはできなかった 41
二項検定 確率を計算しよう 1. 「当たり率が本当に2%だとしたら」という仮定を置く さらに、母集団分布が二項分布であり、 そこから単純ランダムサンプリングで標本が得られた という仮定を置く 2. 実際の結果、あるいはそれより極端な結果が 発生する確率を計算する この確率を𝑝値と呼ぶ SSRの当たり率が2%のガチャを200回実行したとき、 当たりが1回も出ない確率はおよそ1.8% 𝑝値が有意水準(5%)未満なので有意差ありと判断 →このガチャは不正だという理由付けの1つになる 42
二項検定 確率計算のおまけ 例えば300回ガチャを実行して当たりが1つ出たとする →この場合は「当たりが1つ出る確率」と さらに極端である「当たりが1つも出ない確率」の 合計値を利用する →これが「実際の結果、あるいはそれより極端な結果 が発生する確率」の意味 実際の計算は難しいので省略 43
二項検定 終わりに 有意差の有無を判断するには、 中間テストまでずっとやってきた 「母集団」や「標本」などの議論が必要なんだな~と いうイメージは持ってほしい データを入力して、 即座に判断が「ポン」とできる便利な道具 ……というわけではないので注意 44
二項検定で登場した用語など 有意差 意味の有る差 メモ 便宜的にこう呼ぶ 帰無仮説・対立仮説 帰無仮説の例:母集団のパラメータは××と等しい 対立仮説の例:母集団のパラメータは××と異なる 帰無仮説が棄却されたら「有意差あり」と判断する 判断の流れ 帰無仮説を想定したうえで、モデルを用いて、 実際の結果や、より極端な結果が発生する確率を計算。 その確率が「有意水準」を下回る場合には、 帰無仮説を棄却して有意差ありと判断する。 有意水準は5%がしばしば使われるが1%などでも良い
母平均に関する𝒕検定の初歩 二項検定とはまた異なる仮説検定の紹介 詳細は2回後の講義で説明する 初回講義ではおおざっぱな判断の流れを 理解することを目指そう 46
内容 1.統計的仮説検定の流れ 2.検定統計量 3.𝒑値 47
内容 1.統計的仮説検定の流れ 2.検定統計量 3.𝒑値 48
母平均に関する𝒕検定の初歩 標本 ある湖で魚Aを100尾釣った 魚Aの体長の平均が約11cmだった 魚A 疑問 魚Aの母集団における平均体長は 10cmより大きいと言えるか?
母平均に関する𝒕検定の初歩 1.母集団についての仮定を置く(正規母集団+無作為標本) モデルを作る 気温やエサの量など無数の要因で体長が変化したことを 正規分布という「数理的表現」で置き換える 『正規母集団から、単純ランダムサンプリングによって、 標本が得られたというモデル』をこれから利用する データから何かを判断する際に、 仮定を置いていることを意識すること 仮定を置くことで判断が楽になる 50
母平均に関する𝒕検定の初歩 単純ランダムサンプリング 母集団分布は正規分布 母集団についての仮定+標本抽出の仮定 →この仮定を置いていることに注意 51
母平均に関する𝒕検定の初歩 1.母集団についての仮定を置く(正規母集団+無作為標本) 2.帰無仮説と対立仮説を設定する 帰無仮説:母集団の平均体長は10cmと等しい ○○は××と等しい 対立仮説:母集団の平均体長は10cmより大きい ○○は××と異なる(大きい/小さい) 帰無仮説との矛盾の度合いを測ることで 自分の主張したいことを支持する 52
母平均に関する𝒕検定の初歩 1.母集団についての仮定を置く(正規母集団+無作為標本) 2.帰無仮説と対立仮説を設定する 3.有意水準を決定する 𝑝値がどれくらい小さい時に、 帰無仮説を棄却するか決める 多くの場合は0.05が使われる 53
母平均に関する𝒕検定の初歩 1.母集団についての仮定を置く(正規母集団+無作為標本) 2.帰無仮説と対立仮説を設定する 3.有意水準を決定する 4.検定統計量を求める(後述) 5. 𝑝値を計算して、 𝑝値が有意水準を下回るか調べる 54
内容 1.統計的仮説検定の復習 2.検定統計量 3.𝒑値 55
検定統計量 今回は検定統計量として𝑡値を使う 信頼区間の計算でも登場した指標 𝑡値が大きければ、有意差があるとみなせる 𝒕値と有意差の関係性は? 56
検定統計量 平均体長が10cmよりも有意に大きいと言える条件は? 案1:平均値が10cmから離れていたら、有意差あり 青は有意差ありそう 赤は有意差なさそう 10 ↓ データのばらつきも 加味すべき 0 平均15 平均15 57
検定統計量 平均体長が10cmよりも有意に大きいと言える条件は? 案2:平均値が10cmから離れ、ばらつきも小さい 青は有意差ありそう 赤は有意差なさそう 10 ↓ サンプルサイズも 加味すべき 0 平均15 平均15 58
検定統計量 平均体長が10cmよりも有意に大きいと言える条件は? 条件1:平均値が10から離れている 条件2:ばらつき(不偏分散)が小さい 条件3:サンプルサイズが大きい 平均値 − 10 平均値の差 𝑡値= = 標準誤差 分散 ÷ サンプルサイズ 𝑡値が大なら有意差ありと主張できそう 59
内容 1.統計的仮説検定の復習 2.検定統計量 3.𝒑値 60
𝒑値 𝑡値が大ならば、有意差がありそう 「𝑡値が大きい」というのは、どのようにして判断する? 例えば、𝑡値が3だったとして、 その数値は大きい? 小さい? 「確率」に基づいて判断する 確率を計算するときに、𝑡分布を使う 61
𝒕値を「大きい」とみなすかどうかの判断 標本の𝒕値が3の時、この𝑡値が大きいとみなせるか判断したい Step1 標本を、正規母集団から得られた無作為標本と想定 母集団分布のパラメータとして、 帰無仮説(母平均=10)が正しいと仮定 →このモデルでは、標本の𝑡値は𝑡分布に従う 62
𝒕値を「大きい」とみなすかどうかの判断 標本の𝒕値が3の時、この𝑡値が大きいとみなせるか判断したい Step1 標本を、正規母集団から得られた無作為標本と想定 母集団分布のパラメータとして、 帰無仮説(母平均=10)が正しいと仮定 →このモデルでは、標本の𝑡値は𝑡分布に従う 𝒕値 𝑡値= 標本の平均値 − 10 標本から計算された不偏分散 ÷ サンプルサイズ 63
𝒕値を「大きい」とみなすかどうかの判断 標本の𝒕値が3の時、この𝑡値が大きいとみなせるか判断したい Step1 標本を、正規母集団から得られた無作為標本と想定 母集団分布のパラメータとして、 帰無仮説(母平均=10)が正しいと仮定 →このモデルでは、標本の𝑡値は𝑡分布に従う Step2 このとき、偶然で𝑡値が3を超える確率を計算する →これが𝑝値 Step3 𝑝値が有意水準(今回は0.05)よりも小さければ、 標本の𝑡値は十分大きいとみなせるので「有意差あり」と判断
母平均に関する𝒕検定の初歩 1.母集団についての仮定を置く(正規母集団+無作為標本) 2.帰無仮説と対立仮説を設定する 3.有意水準を決定する(今回は0.05) 4.検定統計量を求める(今回は𝑡値) 5. 𝑝値を計算して、 𝑝値が有意水準を下回るか調べる 65
統計的仮説検定を利用する注意点 66
統計的仮説検定を利用する注意点 「絶対正しい」結果がわかるわけでは無い 「絶対に母平均は10と異なる」といったことはわからない 判断を間違える可能性もあるんだけど、 「判断を間違える確率をコントロールしたい」 という意図で用いる手法 利用には細心の注意が必要 67
統計的仮説検定を利用する注意点 メモ 2つの過ち 帰無仮説か対立仮説、どちらかが正しいはず 第一種の過誤 帰無仮説が正しいのに、誤って棄却してしまう 第二種の過誤 帰無仮説が間違っているのに、誤って採択してしまう 統計的仮説検定では、第一種の過誤を 犯す確率をコントロールすることを目指す 68
統計的仮説検定を利用する注意点 検定の非対称性 第一種の過誤を心配 →第二種の過誤が起こる確率はコントロールしていない →2つの過ちの扱いは同じではない 𝑝値が有意水準以下ならば、帰無仮説を棄却する しかし、 𝑝値が有意水準より大きくても 帰無仮説が正しいとは主張できない →検定の非対称性に注意 例えば𝑝値=0.04で、有意水準0.05を下回った →母平均は10と有意に異なる 例えば𝑝値=0.19で、 有意水準を上回った →母平均が10と有意に異なるとは言えない 「10と等しい」 とは言えない 69
統計的仮説検定を利用する注意点 確率の計算の際には「モデル」を用いている • 母集団からの単純ランダムサンプリングという仮定 • 母集団分布が正規分布に従っているという仮定 上記の仮定を置いたモデルを利用して、 𝒑値を計算している → モデルを間違えると「判断を間違える確率」を間違える 「判断を間違える確率」を間違えると、 もはやどうしようもない…… 70
統計的仮説検定を利用する注意点 𝒑値とは 大雑把に言うと「特定の統計モデルのもとで、 データの統計的要約 (たとえば2グループ比較での標本平均の差)が、 観察された値と等しいか、 それよりも極端な値を取る確率である」 『統計的有意性と P 値に関する ASA 声明』より引用 https://www.biometrics.gr.jp/news/all/ASA.pdf 確率の計算には、モデルが必要 モデルから得られた計算結果を利用 71
統計的仮説検定を利用する注意点 統計的仮説検定が目指すこと 母集団のパラメータが「ピッタリ10です」とはわからない →「10と異なるかどうか」を判断しよう(妥協1) 「10と異なるかどうか」が完璧にはわからない →間違うことはあるけど、「第一種の過誤を犯す」確率は できる限りコントロールしよう(妥協2) でも、第一種の過誤を犯す確率も厳密には計算できないよね →単純なモデルを使って確率を計算しよう(妥協3) 仮説検定は、便利ではあるものの、 結果の解釈には細心の注意が必要 72
統計的仮説検定を利用する注意点 統計的仮説検定、難しいし制約が多い わからんでもない 正直使いたくない わからんでもない だが、2022年12月現在、統計的仮説検定は 様々な分野で頻繁に使われている。 自分で使うかどうかは別としても、 仮説検定の結果を自分で解釈する必要がある 正しく使えば便利な手法でもある 73
統計学 II 第11回:統計的仮説検定の解釈
統計的仮説検定を利用する注意点 統計的仮説検定、難しい わかる 制約が多くて、使うのには細心の注意が必要 その通り じゃあ使わない 授業さぼる そうはいかぬ
二項検定の初歩 統計的仮説検定を学ぶとは 1.検定の手続きを学ぶ(用語が多くて大変) 2.検定の限界や利用の際の注意点を学ぶ 実行できるようになるのが大変 実行できるようになった後も大変 じゃあなんでこんなものを学ぶのか 76
内容 1.統計的仮説検定の利用例 2.統計的仮説検定の結果の解釈 3.統計的仮説検定の悪用と対策 77
統計的仮説検定の利用例 78
統計的仮説検定の利用例 新型コロナウイルスのワクチン接種について ワクチンって本当に効果あるの? 何回も打たなきゃいけないの? デルタ株やオミクロン株などいろいろあるけど 効き目に違いがあるの? データから判断する必要性は高い 79
統計的仮説検定の利用例 新型コロナウイルスのワクチン接種について 『ワクチン接種後約2ヶ月の時点で、88~100%の接種者が従来株、 アルファ株およびデルタ株などの変異株に対して 中和抗体を保有していましたが、 オミクロン株に対する保有率は、わずか28%でした。 一方、デルタ株などでは若年者では、 高齢者より有意に高い中和抗体が誘導されていたものの、 オミクロン株に対しては、 若年者においても低い中和抗体価を示し、 年齢差は認められませんでした。』 引用:新型コロナウイルスmRNAワクチン接種により誘導されるオミクロン株に対する中和抗体 2022年12月4日最終閲覧 https://www.kobe-u.ac.jp/research_at_kobe/NEWS/collaborations/2022_02_01_02.html 80
統計的仮説検定の利用例 新型コロナウイルスのワクチン接種について 『ワクチン接種後約2ヶ月の時点で、88~100%の接種者が従来株、 アルファ株およびデルタ株などの変異株に対して 中和抗体を保有していましたが、 有意の文字が! オミクロン株に対する保有率は、わずか28%でした。 一方、デルタ株などでは若年者では、 高齢者より有意に高い中和抗体が誘導されていたものの、 オミクロン株に対しては、 若年者においても低い中和抗体価を示し、 年齢差は認められませんでした。』 引用:新型コロナウイルスmRNAワクチン接種により誘導されるオミクロン株に対する中和抗体 2022年12月4日最終閲覧 https://www.kobe-u.ac.jp/research_at_kobe/NEWS/collaborations/2022_02_01_02.html 81
統計的仮説検定の利用例 新型コロナウイルスのワクチン接種について 先の報告では統計的仮説検定を利用して 若年層と高齢層で違いがあるかどうかを調べた。 他にも元論文を読むと様々な比較と 統計的仮説検定が実施されているのがわかる (専門外の教員が 間違った知識を伝えるわけにはいかないので コロナに関する説明は本授業で行わない) 引用:新型コロナウイルスmRNAワクチン接種により誘導されるオミクロン株に対する中和抗体 2022年12月4日最終閲覧 https://www.kobe-u.ac.jp/research_at_kobe/NEWS/collaborations/2022_02_01_02.html 82
統計的仮説検定の利用例 統計分析を行った後のいろいろな表記について CI(Confidence Interval)は信頼区間の意味 代表値だけでなくCIも併記することが多い 仮説検定の結果と区間推定の結果を併記することは しばしばある P=○○やp-value=○○という数値は 統計的仮説検定を行った結果の𝑝値のこと 統計的仮説検定といっても手法は様々ある (二項検定・母平均に関する𝑡検定、等々) どのような分析方法が利用されているかは、 元の論文などをしっかり確認する必要がある 仮説検定がわからないと論文が読めない! 83
統計的仮説検定の利用例 品質管理と統計的仮説検定 直径5mmのネジを作っている工場がある このネジは本当に直径5mmになっているだろうか? 平均すると4.8mmになっているのでは? →ネジの直径が5mmと異なるかどうかの判断をしたい 農業と統計的仮説検定 肥料や生育条件によって作物の育ちが変わるのかどうか データを使って判断したい データから判断することは多い 84
統計的仮説検定の解釈 85
統計的仮説検定の解釈 統計的仮説検定は、便利ではある はい じゃあ「差がある」かどうか調べる場合は 常に統計的仮説検定を使ったらいいね まぁ、よく使うんだけど 「ご神託」とは違うので気を付けるように
統計的仮説検定の解釈 統計的仮説検定が目指すこと 母集団のパラメータが「ピッタリ10です」とはわからない →「10と異なるかどうか」を判断しよう(妥協1) 「10と異なるかどうか」が完璧にはわからない →間違うことはあるけど、「第一種の過誤を犯す」確率は できる限りコントロールしよう(妥協2) でも、第一種の過誤を犯す確率も厳密には計算できないよね →単純なモデルを使って確率を計算しよう(妥協3) 先週も説明したが もう一度統計的仮説検定の解釈を復習 87
統計的仮説検定の解釈 解説の前提 統計的仮説検定には様々な種類がある 一般論を述べるとわかりにくいので 「母平均に関する𝑡検定」を対象とする 88
内容 1.母平均に関する𝒕検定の復習 2.検定の非対称性の復習 3.分析をする際に想定している仮定 89
内容 1.母平均に関する𝒕検定の復習 2.検定の非対称性の復習 3.分析をする際に想定している仮定 90
内容 1.母平均に関する𝒕検定の復習 2.検定の非対称性の復習 3.分析をする際に想定している仮定 91
内容 1.母平均に関する𝒕検定の復習 2.検定の非対称性の復習 3.分析をする際に想定している仮定 92
統計的仮説検定の悪用と対策 93
内容 1.有意差はすべてを解決する! 2.何が何でも有意な結果にしてやるぜ! 3.黙っていれば、ばれないよ! 94
内容 1.有意差はすべてを解決する! 2.何が何でも有意な結果にしてやるぜ! 3.黙っていれば、ばれないよ! 有意差の解釈についての注意点 95
有意差の解釈 𝑝値が小さければ、このダイエット薬には 効果があると言えるんや~ 有意差がありさえすれば、 ダイエット薬を売って大金持ちになれるんや~ やめて
有意差の解釈 𝑝値が有意水準を下回れば有意か 𝑝値は小さいほうがいいんだな ということは、 𝑝値が小さければ小さいほど 差が大きいと言えるわけか 全然ちがう
有意差の解釈 𝑡検定では𝑡値を検定統計量に利用する 𝒕値の特徴 条件1:平均値が10から離れている(10より大きい) 条件2:ばらつき(不偏分散)が小さい 条件3:サンプルサイズが大きい 平均値 − 10 平均値の差 𝑡値= = 標準誤差 分散 ÷ サンプルサイズ 差の大きさ、ばらつきの小ささ サンプルサイズの大きさすべてを考慮! 98
有意差の解釈 統計的仮説検定におけるよくある間違い 𝑝値が小さかったので差が大きいよ~ ばらつきが小さかっただけかも サンプルサイズが大きかっただけかも 基本的に、サンプルサイズが大きいと 有意差は出やすくなる 何はともあれ有意だったらそれでよくない?
有意差の解釈 このダイエット薬は、有意に体重を減らすよ! 𝑝値はなんと驚愕の0.0001だ!! あるダイエット薬の効能評価 1万人を対象に調査した(サンプルサイズ大) 1g単位で計測した ダイエット薬を飲むと、5%水準で有意に体重が減少した ダイエット薬を飲んだ人と飲まない人の 体重の差は平均して50g 50gだけ体重が減っても、 見た目はほとんど変わらないよ
有意差の解釈 有意差の解釈の上での注意点① 有意差あり 差が大きい 有意差はサンプルサイズやデータのばらつきも考慮する 逆に言えば、差が大きくても観測誤差が大きいだけかも 有意差の解釈の上での注意点② 有意差あり 私たちの生活に 影響が有る 「意味の有る差」という表現はあくまで便宜的なもの
内容 1.有意差はすべてを解決する! 2.何が何でも有意な結果にしてやるぜ! 3.黙っていれば、ばれないよ! 無理やり有意差を出す方法(悪用厳禁) 102
有意差は簡単に出せる(悪用厳禁) どんな行為がダイエットに効くか知りたいな~ データをたくさん集めるぜ~
有意差は簡単に出せる(悪用厳禁) ダイエットに効く行動の調査(架空のデータ) ある行動をした/しなかった、場合で 体重に有意差が出るかどうかを何度も検定 有意差 演奏 パーティ 釣り なし なし あり 有意差見つけた~! アボカドを 食べる なし
有意差は簡単に出せる(悪用厳禁) ※架空の結果 重大発表があります! なんと、釣りをしたら痩せる! やめて この議論のどこが問題なのだろう?
有意差は簡単に出せる(悪用厳禁) 統計的仮説検定を使う理由 第一種の過誤(差がないという帰無仮説を間違って棄却) を犯す確率をコントロールするため モデルの前提などが正しく、有意水準を5%にしたなら、 誤って「有意差あり」と言ってしまう確率は5%に 抑えることができるはず 釣りがダイエットに効くという主張が間違って いる確率はたったの5%だ! 実は、かなり難しい問題 106
有意差は簡単に出せる(悪用厳禁) ダイエットに効く行動の調査(架空のデータ) ある行動をした/しなかった、場合で 体重に有意差が出るかどうかを何度も検定 演奏 5%の確率で 誤って棄却 パーティ 釣り アボカドを 食べる
有意差は簡単に出せる(悪用厳禁) ダイエットに効く行動の調査(架空のデータ) ある行動をした/しなかった、場合で 体重に有意差が出るかどうかを何度も検定 演奏 パーティ 5%の確率で 誤って棄却 釣り アボカドを 食べる
有意差は簡単に出せる(悪用厳禁) ダイエットに効く行動の調査(架空のデータ) ある行動をした/しなかった、場合で 体重に有意差が出るかどうかを何度も検定 演奏 パーティ 釣り 5%の確率で 誤って棄却 アボカドを 食べる
有意差は簡単に出せる(悪用厳禁) ダイエットに効く行動の調査(架空のデータ) ある行動をした/しなかった、場合で 体重に有意差が出るかどうかを何度も検定 演奏 パーティ 釣り アボカドを 食べる 5%の確率で 誤って棄却
クイズ 表が出る確率が5%のコインを 4回投げて、 どれか1つでも表になる確率は? 確率を計算しよう 第一種の過誤を犯す確率が5%の仮説検定を 4回行い、どれか1つでも第一種の過誤が 発生してしまう確率は? ① 5% ② 15% ③ 19% ④ 24%
クイズ(回答) 表が出る確率が5%のコインを 4回投げて、 どれか1つでも表になる確率は? 確率を計算しよう 第一種の過誤を犯す確率が5%の仮説検定を 4回行い、どれか1つでも第一種の過誤が 発生してしまう確率は? ① 5% ② 15% ③ 19% ④ 24%
クイズ(回答) 計算方法 まずは1度も過ちを犯さない確率を計算する 第一種の過誤を犯す確率が5%ということは、 過ちを犯さない確率は95% 95%で起こることが4回連続で起こる確率を計算 0.95 × 0.95 × 0.95 × 0.95 ≈ 0.815 4回連続過ちを犯さない確率は81.5% どれか1回でも過ちを犯す確率は1 − 0.815 = 0.185 なので大体19% 113
有意差は簡単に出せる(悪用厳禁) ダイエットに効く行動の調査(架空のデータ) ある行動をした/しなかった、場合で 体重に有意差が出るかどうかを何度も検定 演奏 パーティ 釣り アボカドを 食べる 1回につき5%間違う検定を、4回連続で実施すると どれか1つが間違う確率は5%より大きくなる (19%くらい間違う) 何度も検定すると、どこかで間違う
有意差は簡単に出せる(悪用厳禁) 仕方ない、検定の対象は1つだけにするか やばい、有意差が出なかった。効果なしか!? いや、まだいける!! だって、検定には複数の種類があるんだから!
有意差は簡単に出せる(悪用厳禁) ダイエットに効く行動の調査(架空のデータ) 演奏をした/しなかった、場合で 体重に有意差が出るかどうかを仮説検定で調べた 手法 有意差 𝑡検定 無し 𝑈検定 無し 𝑍検定 有り 有意差が出るまで検定の手法を ひたすら替えるのは、もちろんダメ
有意差は簡単に出せる(悪用厳禁) 様々なズル 仮説検定の手法の切り替え以外にも (行うべきでない)有意差を出すズルはたくさんある 例)変数変換:データを対数変換するなど (対数変換するべき時もあるが、悪用は厳禁) 一部のデータの排除 逆に異常値をそのまま放置する 自分が欲しい結果を得るために 分析結果を改ざんしてはいけない!
有意差は簡単に出せる(悪用厳禁) 有意差を無理やり出すことは避けよう 統計的仮説検定は第一種の過誤を犯す確率を コントロールすることに努めた手法 →モデルの仮定が満たされている時など、 うまく使えば、第一種の過誤を犯す確率は 有意水準に抑えられる →「有意差を無理に出す」ということは、 第一種の過誤を犯す確率のコントロールが もはや効かなくなってしまったということ
内容 1.有意差はすべてを解決する! 2.何が何でも有意な結果にしてやるぜ! 3.黙っていれば、ばれないよ! 仮説検定以外の結果も併記しよう! 119
黙っていれば、ばれないよ(ダメ) 唐突にひらめいた! 4回の検定をしたと公表したから怒られたんだ 有意差が出た仮説検定の結果だけを公表しよう やめて データ分析者としての倫理観の問題 情報はなるべく開示するべき
黙っていれば、ばれないよ(ダメ) 仮説検定の結果だけに頼るのは避けよう 理由は思いつかないけど、有意差が出たから 「釣りをすれば痩せる」と結論付けよう やめて 統計的仮説検定は判断のサポート役 根拠をすべて仮説検定に任せるのは避ける
黙っていれば、ばれないよ(ダメ) 判断の根拠はしっかりと開示する 統計的仮説検定の結果(有意差の有無)だけを公表 元データの情報(グラフも含む)も公表 統計的仮説検定以外の根拠も述べる
黙っていれば、ばれないよ(ダメ) 統計的仮説検定についての馬場の意見(個人の意見) 「統計的仮説検定には問題があるから使うな」は 極端すぎる意見だと思う →代わりになる手法(情報量規準・ベイズ統計学など)も 突き詰めればやはり利用者の問題がネックになる →「ずる」ができない手法は、多分無いと思う 逆に「何が何でも仮説検定を実施すべきだ」も 極端すぎる意見だと思う 統計的仮説検定が果たす役割と 統計的仮説検定が内在する課題を理解して 過剰な期待はしないで使う 123
統計学 II 第12回:母平均に関する検定1 (1標本問題)
内容 1.母平均に関する𝒕検定の復習 2.棄却域の利用 3.片側検定と両側検定 4.計算演習 125
母平均に関する𝒕検定の復習 126
母平均に関する𝒕検定の復習 標本 ある湖で魚Aを100尾釣った 魚Aの体長の平均が約11cmだった 魚A 疑問 魚Aの母集団における平均体長は 10cmより大きいと言えるか?
母平均に関する𝒕検定の復習 1.母集団についての仮定を置く(正規母集団+無作為標本) 128
母平均に関する𝒕検定の復習 単純ランダムサンプリング 母集団分布は正規分布 母集団についての仮定+標本抽出の仮定 →この仮定を置いていることに注意 129
母平均に関する𝒕検定の復習 1.母集団についての仮定を置く(正規母集団+無作為標本) 2.帰無仮説と対立仮説を設定する 帰無仮説:母集団の平均体長は10cmと等しい ○○は××と等しい 対立仮説:母集団の平均体長は10cmより大きい ○○は××と異なる(大きい/小さい) 帰無仮説との矛盾の度合いを測ることで 自分の主張したいことを支持する 130
母平均に関する𝒕検定の復習 1.母集団についての仮定を置く(正規母集団+無作為標本) 2.帰無仮説と対立仮説を設定する 3.有意水準を決定する 𝑝値がどれくらい小さい時に、 帰無仮説を棄却するか決める 多くの場合は0.05が使われる 131
母平均に関する𝒕検定の復習 1.母集団についての仮定を置く(正規母集団+無作為標本) 2.帰無仮説と対立仮説を設定する 3.有意水準を決定する 4.検定統計量を求める 132
母平均に関する𝒕検定の復習 平均体長が10cmよりも有意に大きいと言える条件は? 条件1:平均値が10から離れている(10より大きい) 条件2:ばらつき(不偏分散)が小さい 条件3:サンプルサイズが大きい 平均値 − 10 平均値の差 𝑡値= = 標準誤差 分散 ÷ サンプルサイズ 𝑡値が大なら有意差ありと主張できそう 133
母平均に関する𝒕検定の復習 1.母集団についての仮定を置く(正規母集団+無作為標本) 2.帰無仮説と対立仮説を設定する 3.有意水準を決定する 4.検定統計量を求める 5. 𝑝値を計算して、 𝑝値が有意水準を下回るか調べる 134
母平均に関する𝒕検定の復習 𝑡値が大ならば、有意差がありそう 「𝑡値が大きい」というのは、どのようにして判断する? 例えば、𝑡値が3だったとして、 その数値は大きい? 小さい? 「確率」に基づいて判断する 確率を計算するときに、𝑡分布を使う 135
母平均に関する𝒕検定の復習 標本の𝒕値が3の時、この𝑡値が大きいとみなせるか判断したい Step1 標本を、正規母集団から得られた無作為標本と想定 母集団分布のパラメータとして、 帰無仮説(母平均=10)が正しいと仮定 →このモデルでは、標本の𝑡値は𝑡分布に従う 136
母平均に関する𝒕検定の復習 標本の𝒕値が3の時、この𝑡値が大きいとみなせるか判断したい Step1 標本を、正規母集団から得られた無作為標本と想定 母集団分布のパラメータとして、 帰無仮説(母平均=10)が正しいと仮定 →このモデルでは、標本の𝑡値は𝑡分布に従う 𝒕値 𝑡値= 標本の平均値 − 10 標本から計算された不偏分散 ÷ サンプルサイズ 137
母平均に関する𝒕検定の復習 標本の𝒕値が3の時、この𝑡値が大きいとみなせるか判断したい Step1 標本を、正規母集団から得られた無作為標本と想定 母集団分布のパラメータとして、 帰無仮説(母平均=10)が正しいと仮定 →このモデルでは、標本の𝑡値は𝑡分布に従う Step2 このとき、偶然で𝑡値が3を超える確率を計算する →これが𝑝値 Step3 𝑝値が有意水準(今回は0.05)よりも小さければ、 標本の𝑡値は十分大きいとみなせるので「有意差あり」と判断
母平均に関する𝒕検定の復習 最終判断 𝑝値が有意水準を下回った →帰無仮説を棄却する →母平均は有意に10より大きいと報告する 𝑝値が有意水準を上回った →帰無仮説を棄却できない →母平均は有意に10より大きいとは言えないと報告する (「母平均は10と等しい」と言ってはいけない) 139
棄却域の利用 手計算でも𝒕検定を実行できる 簡便な方法を紹介 140
棄却域の利用 𝒑値の計算は大変 𝑝値を求めるためには𝑡分布を用いた確率計算が必要 →これを手計算で行うのはすごく大変 𝒕分布のパーセント点の利用 区間推定の時のように、 𝑡分布のパーセント点の表を利用して 統計的仮説検定を行う方法を検討する 141
棄却域の利用 棄却域・受容域 帰無仮説を棄却するか否かを 判断するために用いられる検定統計量の範囲 検定統計量が棄却域に含まれる →帰無仮説を棄却する 検定統計量が受容域に含まれる →帰無仮説を棄却しない 142
棄却域の利用 棄却域・受容域の求め方 検定統計量が棄却域に入るならば 帰無仮説を棄却する この時、第一種の過誤を犯す確率が 有意水準に抑えられるようにする必要がある 有意水準と𝑡分布のパーセント点を参照することで 棄却域・受容域を求める 143
パーセント点の復習 𝒕分布から計算できる%点 確率変数𝑌が「ある値𝑡𝛼 」以下となる確率が100𝛼%である → 𝑃 𝑌 ≤ 𝑡𝛼 = 𝛼 →このような𝑡𝛼 のことを「100𝛼%点」と呼ぶ 例) 𝛼 = 0.05の場合𝑃 𝑌 ≤ 𝑡0.05 = 0.05となる 𝑡0.05 は5%点 𝛼 = 0.025の場合𝑃 𝑌 ≤ 𝑡0.025 = 0.025となる 𝑡0.025 は2.5%点 自由度(サンプルサイズから求まる)さえ 決めれば、機械的に計算可能 144
パーセント点の復習 𝒕分布から計算できる%点(自由度が4の時) 確率変数𝑌が「ある値𝑡𝛼 」以下となる確率が100𝛼%である → 𝑃 𝑌 ≤ 𝑡𝛼 = 𝛼 →このような𝑡𝛼 のことを「100𝛼%点」と呼ぶ 例) 𝛼 = 0.05の場合𝑃 𝑌 ≤ 𝑡0.05 = 0.05となる 𝑡0.05 は5%点𝑡0.05 ≈ −2.132 𝛼 = 0.025の場合𝑃 𝑌 ≤ 𝑡0.025 = 0.025となる 𝑡0.025 は2.5%点𝑡0.025 ≈ −2.776 大体の統計分析ソフトウェアを使えば、 この程度の計算は簡単にできる 145
パーセント点の復習 𝒕分布から計算できる%点色々(自由度が4の時) 参考(覚えなくていい) 2.5%点 𝑡0.025 ≈ −2.776 𝑡0.05 ≈ −2.132 5%点 10%点 50%点 90%点 𝑡0.1 ≈ −1.533 𝑡0.5 = 0 𝑡0.9 ≈ 1.533 ←50%点=中央値 95%点 𝑡0.95 ≈ 2.132 97.5%点 𝑡0.975 ≈ 2.776 146
パーセント点の復習 自由度4の𝒕分布の%点
パーセント点の復習 自由度4の𝒕分布の%点 𝑡0.9 ≈ 1.553 𝑡0.9 以下になる確率は90%
パーセント点の復習 自由度4の𝒕分布の%点 𝑡0.9 ≈ 1.553 𝑡0.9 以上になる確率は10%
パーセント点の復習 自由度4の𝒕分布の%点 𝑡0.95 以下になる確率は95% 𝑡0.95 ≈ 2.132
パーセント点の復習 自由度4の𝒕分布の%点 𝑡0.95 以上になる確率は5% 𝑡0.95 ≈ 2.132
パーセント点の復習 自由度4の𝒕分布の%点 𝑡0.975 ≈ 2.776 𝑡0.975 以下になる確率は97.5%
パーセント点の復習 自由度4の𝒕分布の%点 𝑡0.975 ≈ 2.776 𝑡0.975 以上になる確率は2.5%
棄却域の利用 𝑡値が大ならば、有意差がありそう 「𝑡値が大きい」というのは、どのようにして判断する? 例えば、𝑡値が3だったとして、 その数値は大きい? 小さい? 「確率」に基づいて判断する 確率を計算するときに、𝑡分布を使う 棄却域を使って判断を下す 154
棄却域の利用 棄却域とパーセント点 正規母集団からの無作為標本を想定したとき、 𝑡値が棄却域に含まれるならば帰無仮説を棄却する →誤って帰無仮説を棄却する確率は有意水準(5%)に抑えたい 自由度4の𝒕分布のパーセント点 𝑡0.95 ≈ 2.132 もしもサンプルサイズ5の標本において 𝑡値2.132だったとする。 𝑡値が2.132を上回る確率は5%となる 𝑡値が95%点、すなわち2.132よりも大きいときに 帰無仮説を棄却すればOK 155
棄却域の利用 棄却域を使った𝒕検定(もう少し厳密に) 標本から計算される𝑡値を𝑡𝑠𝑎𝑚𝑝𝑙𝑒 と記す 有意水準を𝛼とする 𝑡分布における100 1 − 𝛼 %点を𝑡1−𝛼 と記す 棄却域は以下の範囲を取る 𝑡1−𝛼 < 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 が棄却域に含まれるならば、帰無仮説を棄却する 例えば5%有意水準なら𝛼 = 0.05なので 𝑡0.95 すなわち95%点を参照して棄却域を求める → 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 が95%点を超えていたら帰無仮説を棄却する 156
片側検定と両側検定 棄却域や𝒑値を求める際の注意点 157
内容 1.片側検定 2.両側検定 158
内容 1.片側検定 2.両側検定 159
片側検定 2.帰無仮説と対立仮説を設定する 帰無仮説:母集団の平均体長は10cmと等しい ○○は××と等しい 対立仮説:母集団の平均体長は10cmより大きい ○○は××より大きい 今回は母平均が10より「大きい」か ということだけを調べた 160
片側検定 2.帰無仮説と対立仮説を設定する 帰無仮説:母集団の平均体長は10cmと等しい ○○は××と等しい 対立仮説:母集団の平均体長は10cmより小さい ○○は××より小さい 母平均が10より「小さい」か ということを調べることも可能 161
片側検定 右片側検定 「○○は××より大きい」を対立仮説にする (小さいことは考慮しない) 左片側検定 「○○は××より小さい」を対立仮説にする (大きいことは考慮しない) 2つの片側検定を想定できる どちらを使うかは、分析の目的次第 162
片側検定 帰無仮説:母集団の平均体長は10cmと等しい 𝑡値= 標本の平均値 − 10 標本から計算された不偏分散 ÷ サンプルサイズ 右片側検定の時に考慮する𝒕値 標本平均が10cmより大きいなら、 𝑡値は0以上をとる 左片側検定の時に考慮する𝒕値 標本平均が10cmより小さいなら、 𝑡値は0以下をとる 163
メモ 片側検定 標本から計算される𝑡値を𝑡𝑠𝑎𝑚𝑝𝑙𝑒 と記す 有意水準を𝛼とする 𝑡分布における100 1 − 𝛼 %点を𝑡1−𝛼 と記す 𝑡分布における100𝛼%点を𝑡𝛼 と記す 右片側検定の時の棄却域 𝑡1−𝛼 < 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 左片側検定の時の棄却域 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 < 𝑡𝛼 例えば5%有意水準なら𝛼 = 0.05である 右片側検定なら𝑡0.95 すなわち95%点を参照して棄却域を求める 左片側検定なら𝑡0.05 すなわち 5%点を参照して棄却域を求める 164
片側検定 𝒕分布から計算できる%点色々(自由度が4の時) 参考(覚えなくていい) 2.5%点 𝑡0.025 ≈ −2.776 𝑡0.05 ≈ −2.132 5%点 10%点 50%点 90%点 𝑡0.1 ≈ −1.533 𝑡0.5 = 0 𝑡0.9 ≈ 1.533 ←50%点=中央値 95%点 𝑡0.95 ≈ 2.132 97.5%点 𝑡0.975 ≈ 2.776 165
内容 1.片側検定 2.両側検定 166
両側検定 2.帰無仮説と対立仮説を設定する 帰無仮説:母集団の平均体長は10cmと等しい ○○は××と等しい 対立仮説:母集団の平均体長は10cmと異なる ○○は××と異なる 小さいか大きいかは気にしない 異なるかどうかを調べるのが両側検定 167
両側検定 帰無仮説:母集団の平均体長は10cmと等しい 𝑡値= 標本の平均値 − 10 標本から計算された不偏分散 ÷ サンプルサイズ 標本平均が帰無仮説と比べて大きいとき 標本平均が10cmより大きいなら、 𝑡値は0以上をとる 標本平均が帰無仮説と比べて小さいとき 標本平均が10cmより小さいなら、 𝑡値は0以下をとる 168
両側検定 大きな𝑡値(大きな標本平均)が得られたぞ 小さな𝑡値(小さな標本平均)が 得られた時のことも考えましょう 小さな𝑡値(小さな標本平均)が得られたぞ 大きな𝑡値(大きな標本平均)が 得られた時のことも考えましょう 両方考える、両側検定
メモ 両側検定 両側検定の棄却域その① 𝑡値が正(標本平均が帰無仮説より大きかった)の時 𝑡1−𝛼 < 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 2 両側検定の棄却域その② 𝑡値が負(標本平均が帰無仮説より小さかった)の時 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 < 𝑡𝛼 2 例えば5%有意水準なら𝛼 = 0.05である 𝑡値が正なら𝑡0.975 すなわち97.5%点を参照して棄却域を求める 𝑡値が負なら𝑡0.025 すなわち 2.5%点を参照して棄却域を求める → 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 が2.5%点未満、あるいは97.5%より上なら 170 帰無仮説を棄却する
両側検定の補足 便利な計算方式 𝑡分布は0を中心に左右対称なので 両側検定の棄却域は一般的に以下のように書くことができる 𝑡1−𝛼 < 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 2 パーセント点の書き方も2通り 𝑡分布は0を中心に左右対称なので以下が成り立つ どちらの記号で覚えても結果は変わらない 𝑡1−𝛼 = −𝑡𝛼 2 2 𝑡1−𝛼 = −𝑡𝛼 171
両側検定の補足 信頼区間を 「仮説検定の逆」と導入する 教科書もある 仮説検定と区間推定 棄却域の計算と、信頼区間の計算はよく似ている 実際に、密接な関係がある 母平均の95%信頼区間が帰無仮説を含んでいるなら 有意水準5%の両側検定では帰無仮説を棄却できない 母平均の95%信頼区間が帰無仮説を含まないなら 有意水準5%の両側検定では帰無仮説を棄却できる 統計的仮説検定と同じ結果を、 信頼区間を使って得ることもできる 172
計算演習 173
検定の補足 検定の補足(母分散が既知の場合) ほかの教科書などでは「母分散が既知の場合」と 「母分散が未知の場合」で場合分けをしたうえで 母平均に関する仮説検定を行うことがある →現実的に「母分散が既知」というシチュエーションは ありえないので、今回の講義では省略した 母分散𝜎 2 が既知の場合は𝑡値の代わりに𝑧値を使う 𝑡値 = 𝑋ത − 𝜇 𝑈 2ൗ 𝑛 𝑋ത − 𝜇 = 𝑆𝐸 𝑧値 = 𝑋ത − 𝜇 𝜎 2ൗ 𝑛 174
検定の補足 𝑧値 = 𝑋ത − 𝜇 𝜎 2ൗ 𝑛 検定の補足(母分散が既知の場合) 標本抽出のモデルを利用すると 𝑧値は標準正規分布に従うことが証明できる 標準正規分布は、平均0、分散1の正規分布 自由度などは考慮しなくてもOK →計算がちょっと簡単になる →でも、利用できるシチュエーションはほぼ存在しない 175
検定の補足 𝑧値 = 𝑋ത − 𝜇 𝜎 2ൗ 𝑛 検定の補足(母分散が既知の場合) 自由度が無限である𝑡分布は標準正規分布と一致する →サンプルサイズが増えると、 𝑡分布と標準正規分布のどちらを使っても、 計算結果はほとんど変わらない →とはいえ、標準正規分布を使う積極的な理由もない 176
統計学 II 第13回:母平均に関する検定2 (2標本問題)
母平均に関する𝒕検定(今までの課題) 標本 ある湖で魚Aを100尾釣った 魚Aの体長の平均が約11cmだった 魚A 疑問 魚Aの母集団における平均体長は 10cmと異なると言えるか?
母平均に関する𝒕検定(これからの課題) 標本 ある湖で魚Xを100尾、と魚Yを80尾釣った 魚Xの体長の平均が約11cmだった 魚Yの体長の平均が約 8cmだった 魚X 魚Y 疑問 魚Xの体長の母平均と魚Yの母平均は 異なると言えるか?
内容 1.対応のあるt検定 2.分散が等しい場合の二標本検定 3.分散が等しくない場合の二標本検定 全ての説明では母分散未知と想定 (母分散が既知の時の説明は省略) 180
対応のあるt検定 先週行った1標本の検定とほぼ同じ! 181
内容 1.問題設定 2.検定のやり方 182
内容 1.問題設定 2.検定のやり方 183
問題設定 ダイエット薬を作ったよ! ごまかし無し! 効果があると言えるか、検定しようか 薬を飲む前 薬を飲んだ後 山田さん 55kg 45kg 田中さん 50kg 45kg 佐藤さん 62kg 58kg 184
問題設定 家庭教師を始めたよ! みんな成績UPだ! 効果があると言えるか、検定しようか 講義をする前 講義をした後 山田さん 70点 72点 田中さん 80点 78点 佐藤さん 90点 90点 185
問題設定 対応のある場合 「対応がある」とは、 例えば同じ人を対象にした時など 目指すこと 「対応がある」対象同士で 変化があったかどうかを調べる
内容 1.問題設定 2.検定のやり方 以下ではすべて、データが、 正規母集団からの無作為標本であると想定する 187
検定のやり方 ダイエット薬の効果は? Step1:薬を飲む前と飲んだ後で体重の差分を取る 薬を飲む前 薬を飲んだ後 山田さん 55kg 45kg 田中さん 50kg -10 45kg -5 佐藤さん 62kg 58kg -4 188
検定のやり方 ダイエット薬の効果は? Step1:薬を飲む前と飲んだ後で体重の差分を取る -10, -5, -4 Step2:上記の差分値に対して 「母平均が0と異なるかどうか」の検定を実施 有意に0と異なる 有意に0と異なるとは言えない 有意な効果が認められた (もちろん過信は禁物だが) 有意な効果が 認められなかった 189
検定のやり方 家庭教師の効果は? Step1:講義をする前とした後で点数の差分を取る 講義をする前 山田さん 70点 田中さん 80点 講義をした後 +2 72点 78点 -2 佐藤さん 90点 90点 0 190
検定のやり方 家庭教師の効果は? Step1:講義をする前とした後で点数の差分を取る 2, -2, 0 Step2:上記の差分値に対して 「母平均が0と異なるかどうか」の検定を実施 有意に0と異なる 有意に0と異なるとは言えない 有意な効果が認められた (もちろん過信は禁物だが) 有意な効果が 認められなかった 191
分散が等しい場合の二標本検定 192
分散が等しい場合の二標本検定 標本 ある湖で魚Xを3尾、と魚Yを2尾釣った 魚Xと魚Yの体長の母平均に差があるか調べたい ただし魚Xと魚Yはともに分散が等しい正規母集団からの 無作為標本であると想定する 魚X 魚Y 疑問 魚Xの体長の母平均と魚Yの母平均は 異なると言えるか?
問題設定 分散が等しい場合の二標本検定 「母平均」については等しいかどうか不明 →だから検定を行って調べる 「母分散」については等しいと想定 →同じ湖にいるのだから、分散は等しいと言えるだろう? 対応関係について 2種類の別の魚を対象にしている 各々のサンプルサイズは異なる お互いの標本に対応関係はない
分散が等しい場合の二標本検定 一標本検定の場合の𝒕値 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 標本の平均値 − 帰無仮説の母平均の値 標本から計算された不偏分散 ÷ サンプルサイズ 二標本検定の場合の𝒕値 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 魚𝑋の標本平均 − 魚𝑌の標本平均 プールされた分散 × 1 1 + 𝑋のサンプルサイズ 𝑌のサンプルサイズ この数式を解読しよう!
分散が等しい場合の二標本検定 ത 𝑋:標本Xの標本平均 ത 𝑌:標本Yの標本平均 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ 一標本の場合の不偏分散 𝑚 𝑈2 1 = 𝑋𝑖 − 𝑋ത 𝑚−1 2 𝑖=1 二標本検定の場合のプールされた分散 𝑚 2 𝑈𝑝𝑜𝑜𝑙 1 = 𝑋𝑖 − 𝑋ത 𝑚+𝑛−2 𝑖=1 𝑛 2 + 𝑌𝑗 − 𝑌ത 2 𝑗=1 ※「プールする」とは 「混ぜ合わせる」「一緒にする」くらいの意味
分散が等しい場合の二標本検定 一標本検定の場合の𝝌𝟐 値 𝑛−1 2 𝑈 2 𝜎 𝜎 2 :母分散(標本X,Yで共通) 母分散の影響をなくすために変換(𝝌𝟐 値のようなもの) 𝑚+𝑛−2 2 𝑈𝑝𝑜𝑜𝑙 2 𝜎 プールされた分散を変換したものは 2 自由度𝑚 + 𝑛 − 2の𝜒 分布に従う
分散が等しい場合の二標本検定 一標本検定の場合の標準誤差(𝒕値の分母) 𝑈2 1 ∙ 𝑚 二標本検定の場合の𝒕値の分母 2 𝑈𝑝𝑜𝑜𝑙 1 1 ∙ + 𝑚 𝑛 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ
分散が等しい場合の二標本検定 一標本検定の場合の𝒕値 𝑋ത − 𝜇 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 𝑈2 ∙ 𝑚 𝜇:帰無仮説で想定された母平均 ത 𝑋:標本Xの標本平均 ത 𝑌:標本Yの標本平均 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ 二標本検定の場合の𝒕値 𝑋ത − 𝑌ത 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 1 2 𝑈𝑝𝑜𝑜𝑙 ∙ + 𝑚 𝑛 二標本検定の場合の𝑡値は 自由度𝑚 + 𝑛 − 2の𝑡分布に従う
分散が等しい場合の二標本検定 一標本検定の場合の𝒕値 𝑋ത − 𝜇 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 𝑈2 ∙ 𝑚 二標本検定の場合の𝒕値 𝑋ത − 𝑌ത − 0 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 1 2 𝑈𝑝𝑜𝑜𝑙 ∙ + 𝑚 𝑛 𝜇:帰無仮説で想定された母平均 ത 𝑋:標本Xの標本平均 ത 𝑌:標本Yの標本平均 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ 今回の帰無仮説は、 「標本X,Y」で母平均に差がない
分散が等しい場合の二標本検定 一標本検定の場合の𝒕値 𝑋ത − 𝜇 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 𝑈2 ∙ 𝑚 二標本検定の場合の𝒕値 𝑋ത − 𝑌ത − 5 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 1 2 𝑈𝑝𝑜𝑜𝑙 ∙ + 𝑚 𝑛 𝜇:帰無仮説で想定された母平均 ത 𝑋:標本Xの標本平均 ത 𝑌:標本Yの標本平均 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ この時の帰無仮説は、 「標本X,Y」で標本YはXよりも 母平均が5大きい(参考)
検定の手順の復習(参考) 先週の復習 棄却域・片側検定・両側検定 202
計算演習 203
分散が等しくない場合の二標本検定 計算演習は無し ただし、実務では頻繁に使う コンピュータで計算するのがほぼ必須 204
分散が等しくない場合の二標本検定 標本 ある湖で魚Xを3尾、と魚Yを2尾釣った 魚Xと魚Yの体長の母平均に差があるか調べたい ただし魚Xと魚Yは分散が等しくない正規母集団からの 無作為標本であると想定する 魚X 魚Y 疑問 魚Xの体長の母平均と魚Yの母平均は 異なると言えるか?
分散が等しくない場合の二標本検定 一標本検定の場合の𝒕値 𝑋ത − 𝜇 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 𝑈2 ∙ 𝑚 𝜇:帰無仮説で想定された母平均 ത 𝑋:標本Xの標本平均 ത 𝑌:標本Yの標本平均 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ 𝑈𝑥2 :標本Xの不偏分散 𝑈𝑦2 :標本Yの不偏分散 二標本検定の場合の𝒕値(分散が等しくない場合) 𝑋ത − 𝑌ത 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 2 𝑈𝑥2 𝑈𝑦 + 𝑚 𝑛
分散が等しくない場合の二標本検定 自由度 𝑈𝑥2 Τ𝑚 𝑈𝑥2 Τ𝑚 2 𝑚−1 2 2 Τ + 𝑈𝑦 𝑛 + 2Τ 2 𝑈𝑦 𝑛 𝑛−1 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ 𝑈𝑥2 :標本Xの不偏分散 𝑈𝑦2 :標本Yの不偏分散 この方法をWelchの検定と呼ぶ 自由度が小数点以下の値をとる →数表を見て棄却域を調べるのが困難
統計学 II 第14回:独立性の検定・後期のまとめ
内容 1.クロス集計表 2.独立性の検定 3.後期のまとめ 209
クロス集計表 210
クロス集計表 1.クロス集計表の基本 2.クロス集計表を使うべきとき 211
クロス集計表 1.クロス集計表の基本 2.クロス集計表を使うべきとき 212
度数分布 度数 ある属性に属するデータの数のこと 度数分布 属性と度数を対応させたもの 度数分布表 度数分布を表にしたもの どんなデータが、何個あったかを数える 213
度数分布 度数分布表の例:受講者の学科の構成 25人へのアンケート結果(生データ) 経済学科・経済学科・経済学科・経済学科・経済学科 経済学科・経済学科・経済学科・経済学科・経済学科 国際経済学科・国際経済学科・国際経済学科・国際経済学科・国際経済学科 経営学科・経営学科・経営学科・経営学科・経営学科・経営学科・経営学科 観光経営学科・観光経営学科・観光経営学科 度数分布表 属性(学科) 度数 経済学科 10 国際経済学科 5 経営学科 7 観光経営学科 3
度数分布 度数分布表の例: 受講者の学科の構成 合計:25人 属性(学科) 度数 経済学科 10 国際経済学科 5 経営学科 7 観光経営学科 3 合計:25人 度数分布表の例: 受講者の年齢構成 属性(年齢) 度数 18歳 16 19歳 7 20歳 21歳 1 1
クロス集計表 クロス集計表 カテゴリーごとの度数を記録した表 ただし、通常の度数分布表と異なり 「変数の組み合わせ」で度数を記録する 216
クロス集計表 合計:25人 普通の度数分布表 属性(学科) 経済学科 2022年入学 国際経済学科 経営学科 観光経営学科 度数 10 5 7 3 合計:25人 2021年入学 属性(学科) 経済学科 5 国際経済学科 2 経営学科 13 観光経営学科 5 度数 217
クロス集計表 クロス集計表 学科 経済学科 国際経済学科 経営学科 観光経営学科 入学年度 2022年 2021年 10 5 5 7 2 13 3 5 年度による学科の違いが、 クロス集計表を使えば一目でわかる 218
クロス集計表 生データをクロス集計表へ 生のアンケートデータ 学科 経済学科 入学年度 2022年度 経済学科 経営学科 経営学科 2021年度 2022年度 2022年度 ・・・以下略 学科と入学年度の2つの属性をアンケート 2つの属性の組み合わせで集計する 219
クロス集計表 クロス集計表 学科 2022年度入学 かつ、 経済学科所属は10人 経済学科 国際経済学科 経営学科 観光経営学科 入学年度 2022年 2021年 10 5 5 7 2 13 3 5 学科と入学年度の2つの属性をアンケート 2つの属性の組み合わせで集計する 220
クロス集計表 1.クロス集計表の基本 2.クロス集計表を使うべきとき 221
クロス集計表 クロス集計表を使うべきタイミング ナマズは地震予知ができるか?! 地震あり 暴れた 20 ナマズの行動 暴れていない 2 ナマズが暴れたら、地震が発生する!? ……何かデータが足りていない気がする 222
クロス集計表 クロス集計表を使うべきタイミング ナマズは地震予知ができるか?! 地震の有無 地震あり 地震なし 暴れた 20 ? ナマズの行動 暴れていない 2 ? 地震が発生した時の度数だけを記録 →地震が発生しない時のデータが無い 223
クロス集計表 クロス集計表を使うべきタイミング ナマズは地震予知ができるか?! 地震の有無 地震あり 地震なし 暴れた 20 200 ナマズの行動 暴れていない 2 20 ナマズは常に暴れている ナマズを見て地震を予知するのは難しい 224
クロス集計表 よくある間違い 全ての犯罪者は、普段の生活でお水を飲んでいた! ↓ だから、お水を飲む人は犯罪者だ!!! 水を飲んだか 飲む 飲まない 犯罪の有無 犯罪あり 犯罪なし 10 10000 0 0 225
クロス集計表 よくある間違い 全ての犯罪者は、普段の生活でお水を飲んでいた! ↓ 「犯罪あり」の列だけを見てはいけない だから、お水を飲む人は犯罪者だ!!! 水を飲んだか 飲む 飲まない 犯罪の有無 犯罪あり 犯罪なし 10 10000 0 0 226
クロス集計表 よくある間違い 全ての犯罪者は、普段の生活でお水を飲んでいた! ↓ だから、お水を飲む人は犯罪者だ!!! 水を飲んだか 飲む 飲まない 犯罪の有無 犯罪あり 犯罪なし 10 10000 0 0 犯罪を犯していない人のデータも大事 全人類、水は飲む 227
独立性の検定 先ほどの議論を統計的仮説検定を用いて再検討 228
内容 1.2つの変数が独立であるとき 2.期待度数 3.独立性の検定 229
内容 1.2つの変数が独立であるとき 2.期待度数 3.独立性の検定 230
確率変数の独立(復習) 確率変数の独立 すべての𝑖, 𝑗で下記が成立するとき、 確率変数𝑋, 𝑌が独立であると呼ぶ 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 ∙ 𝑃 𝑌 = 𝑦𝑗 これは、以下と実質同じ意味 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 = 𝑃 𝑌 = 𝑦𝑗 クロス集計表において独立性を検討 231
ナマズと地震予知 地震の有無 𝑌 地震あり 地震なし 20 ナマズの行動 暴れた 𝑋 暴れていない 2 合計 22 200 20 220 合計 220 22 242 232
ナマズと地震予知 地震の有無 𝑌 地震あり 地震なし 20 ナマズの行動 暴れた 𝑋 暴れていない 2 合計 22 200 20 220 合計 220 22 242 ナマズが暴れているという条件時に 地震が発生する確率は20/220=1/11 233
ナマズと地震予知 地震の有無 𝑌 地震あり 地震なし 20 ナマズの行動 暴れた 𝑋 暴れていない 2 合計 22 200 20 220 合計 220 22 242 ナマズが暴れていないという条件時に 地震が発生する確率は2/22=1/11 234
ナマズと地震予知 地震の有無 𝑌 地震あり 地震なし 20 ナマズの行動 暴れた 𝑋 暴れていない 2 合計 22 200 20 220 合計 220 22 242 ナマズに関する条件を排した時 地震が発生する確率は22/242=1/11 235
ナマズと地震予知 ナマズと地震の関係 ナマズの行動を確率変数𝑋と、地震を確率変数𝑌とする ナマズが暴れているという条件での地震発生確率は1/11 ナマズが暴れていないという条件での地震発生確率は1/11 単なる(条件の無い)地震発生確率は1/11 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 = 𝑃 𝑌 = 𝑦𝑗 が成立! ナマズの行動と地震発生は互いに独立 236
内容 1.2つの変数が独立であるとき 2.期待度数 3.独立性の検定 237
期待度数 地震予知のための新技術を開発した! 地震の有無 𝑌 地震あり 地震なし 地震予知 𝑋 地震あり予測 20 地震なし予測 10 合計 30 230 40 270 合計 250 50 300 地震予知の結果と地震発生は関係あり? 238
期待度数 この問題への取り組み方 地震予知の結果と地震発生が無関係(独立)だと想定 →この想定と実際のデータはどれほど離れているか? 期待度数 地震予知の結果と地震発生が無関係(独立)だと想定 →この時の理論上の度数 239
期待度数 期待度数の表 地震の有無 𝑌 地震あり 地震なし 地震予知 𝑋 地震あり予測 ? 地震なし予測 ? 合計 30 ? ? 270 合計 250 50 300 個別の度数を?マークにした 理論上の期待度数を計算していこう! 240
期待度数 期待度数の表 地震の有無 𝑌 地震あり 地震なし 地震予知 𝑋 地震あり予測 ? 地震なし予測 ? 合計 30 ? ? 270 合計 250 50 300 地震予知に関する条件を排した時 地震が発生する確率は30/300=1/10 241
期待度数 期待度数の表 地震の有無 𝑌 地震あり 地震なし 地震予知 𝑋 地震あり予測 ? 地震なし予測 ? 合計 30 ? ? 270 合計 250 50 300 もしも地震予知と地震発生が独立なら 地震予知の結果に関わらず1/10の確率で 地震が発生するはず! 242
期待度数 期待度数の表 地震の有無 𝑌 地震あり 地震なし 地震予知 𝑋 地震あり予測 25 地震なし予測 ? 合計 30 ? ? 270 合計 250 50 300 もしも地震予知と地震発生が独立なら 「地震あり予測」が出たという条件で 「地震あり」になる回数は25回 243
期待度数 期待度数の表 地震の有無 𝑌 地震あり 地震なし 地震予知 𝑋 地震あり予測 25 地震なし予測 5 合計 30 ? ? 270 合計 250 50 300 もしも地震予知と地震発生が独立なら 「地震なし予測」が出たという条件で 「地震なし」になる回数は5回 244
期待度数 期待度数の表 地震の有無 𝑌 地震あり 地震なし 地震予知 𝑋 地震あり予測 25 地震なし予測 5 合計 30 225 45 270 合計 250 50 300 もしも地震予知と地震発生が独立なら 地震があっても無くても9/10の確率で 地震が発生しないはず! 245
内容 1.2つの変数が独立であるとき 2.期待度数 3.独立性の検定 246
独立性の検定 帰無仮説と対立仮説を設定する 帰無仮説:地震予知の結果と地震発生は独立である 対立仮説:地震予知の結果と地震発生は独立でない 有意水準は5%とする
実際のデータの度数 地震予知 𝑋 地震あり予測 20 地震なし予測 10 合計 30 期待度数 地震予知 𝑋 地震の有無 𝑌 地震あり 地震なし 230 40 270 地震の有無 𝑌 地震あり 地震なし 地震あり予測 25 地震なし予測 5 合計 30 225 45 270 独立だと想定した時の期待度数と 実際のデータの度数を比較しよう 合計 250 50 300 合計 250 50 300
実際のデータの度数 地震予知 𝑋 地震あり予測 20 地震なし予測 10 合計 30 期待度数 地震予知 𝑋 地震の有無 𝑌 地震あり 地震なし 230 40 270 地震の有無 𝑌 地震あり 地震なし 地震あり予測 25 地震なし予測 5 合計 30 225 45 270 合計 250 50 300 合計 250 50 300 「度数の差の2乗」を期待度数で割る 2 20 − 25 ÷ 25 = 1
実際のデータの度数 地震予知 𝑋 地震あり予測 20 地震なし予測 10 合計 30 期待度数 地震予知 𝑋 地震の有無 𝑌 地震あり 地震なし 230 40 270 地震の有無 𝑌 地震あり 地震なし 地震あり予測 25 地震なし予測 5 合計 30 225 45 270 合計 250 50 300 合計 250 50 300 「度数の差の2乗」を期待度数で割る 2 10 − 5 ÷ 5 = 5
実際のデータの度数 地震予知 𝑋 地震あり予測 20 地震なし予測 10 合計 30 期待度数 地震予知 𝑋 地震の有無 𝑌 地震あり 地震なし 230 40 270 地震の有無 𝑌 地震あり 地震なし 地震あり予測 25 地震なし予測 5 合計 30 225 45 270 合計 250 50 300 合計 250 50 300 「度数の差の2乗」を期待度数で割る 2 230 − 225 ÷ 225 = 1Τ9
実際のデータの度数 地震予知 𝑋 地震あり予測 20 地震なし予測 10 合計 30 期待度数 地震予知 𝑋 地震の有無 𝑌 地震あり 地震なし 230 40 270 地震の有無 𝑌 地震あり 地震なし 地震あり予測 25 地震なし予測 5 合計 30 225 45 270 合計 250 50 300 合計 250 50 300 「度数の差の2乗」を期待度数で割る 2 40 − 45 ÷ 45 = 5Τ9
独立性の検定 検定統計量 先ほど計算した結果を4マスすべて合計する 1 5 6 2 1 + 5 + + = 6 + = 6 + ≈ 6.67 9 9 9 3 今回の検定統計量を𝜒 2 統計量と呼ぶ (いくつかの想定を満たすなら) 2行2列のクロス集計表における𝜒 2 統計量は、 自由度が1の𝜒 2 分布にしたがう(証明略) 𝜒 2 分布のパーセント点を使って 棄却域を求めていこう 253
独立性の検定 棄却域 自由度1の𝜒 2 分布の95%点≈ 3.84 データから計算された𝜒 2 統計量が3.84を超えるなら 帰無仮説を棄却する 統計的仮説検定の結果 データから計算された𝜒 2 統計量はおよそ6.67 これは棄却域に含まれる 帰無仮説は棄却されたので独立ではない 地震予知は地震発生と関係がありそうだ 254
後期のまとめ 推測統計の理論の総復習 255
内容 1.統計的仮説検定の概要 2.母平均に関する𝒕検定 256
内容 1.統計的仮説検定の概要 2.母平均に関する𝒕検定 257
推測統計の問題意識 湖の中のすべての魚の体長 母集団 すべてのデータ 未知のデータを含む 標本 母集団の一部 手に入ったデータ 釣りをして得られた魚の体長 標本を使って、母集団の議論をしたい 特に今回は母平均を調べたい
統計的推測の難しさ 母平均の推定くらい、簡単? 標本を使って母平均について議論したい 標本は母集団の一部に過ぎないよ。 どのみち母集団のことわかんないだから、 母平均の値なんかテキトーに答えておけばいいわ~♪ 標本を使ってできることは意外と多いよ 259
推測統計の取り組み方 推測統計の問題に、どうやって取り組むのか 認めること① 標本という「一部」しか使わないので 「母集団を完全に明らかにする」ことは無理 認めること② 標本は確率的に変動する 「標本から計算された統計量」も確率的に変動する それでも頑張ること。それでもなお、あきらめないこと 標本や「標本から計算された統計量」が どのように変化するか、確率的な特徴を明らかにする 260
現実世界の単純化 単純ランダムサンプリング 母集団分布は正規分布 母集団についての仮定+標本抽出の仮定 →この仮定を置いていることに注意 261
単純化された現実世界をモデル化 今回の講義の想定 母集団分布は正規分布である 標本は単純ランダムサンプリングで得られる →標本は同一の正規分布に従う独立な確率変数 確率変数 𝑋1 , 𝑋2 , … , 𝑋𝑛 無作為抽出 標本抽出のモデル 𝑋𝑖 ~𝒩 𝜇, 𝜎 2 262
統計的仮説検定の活用 統計的仮説検定とは(ざっくり) ⚫ データを使って判断のサポートをする手法 (あくまでサポートするだけなので注意) ⚫ 第一種の過誤を犯す確率を コントロールすることを目指して判断を行う 第一種の過誤 帰無仮説が正しいのに、誤って棄却してしまう 第二種の過誤 帰無仮説が間違っているのに、誤って採択してしまう 263
統計的仮説検定の活用 統計的仮説検定が目指すこと 母集団のパラメータが「ピッタリ10です」とはわからない →「10と異なるかどうか」を判断しよう(妥協1) 「10と異なるかどうか」が完璧にはわからない →間違うことはあるけど、「第一種の過誤を犯す」確率は できる限りコントロールしよう(妥協2) でも、第一種の過誤を犯す確率も厳密には計算できないよね →単純なモデルを使って確率を計算しよう(妥協3) 仮説検定は、便利ではあるものの、 結果の解釈には細心の注意が必要 264
統計的仮説検定の重要な用語 帰無仮説・対立仮説 帰無仮説:母集団の○○は××と等しい 対立仮説:母集団の○○は××と異なる(大きい/小さい) 帰無仮説との矛盾の度合いを測ることで 自分の主張したいことを支持する 265
統計的仮説検定の重要な用語 右片側検定 「○○は××より大きい」を対立仮説にする (小さいことは考慮しない) 左片側検定 「○○は××より小さい」を対立仮説にする (大きいことは考慮しない) 両側検定 「○○は××と異なる」を対立仮説にする (大きいことも小さいことも考慮する) 266
統計的仮説検定の重要な用語 検定統計量 統計的仮説検定を行う際に用いられる統計量のこと 棄却域 帰無仮説を棄却するか否かを 判断するために用いられる検定統計量の範囲 検定統計量が棄却域に含まれるなら帰無仮説を棄却する 有意水準と棄却域の関係 第一種の過誤を犯す確率を 有意水準と等しくすることを目指す 267
内容 1.統計的仮説検定の概要 2.母平均に関する𝒕検定 268
帰無仮説と対立仮説 一標本の検定の帰無仮説・対立仮説の例 帰無仮説:母平均は○○と等しい 対立仮説:母平均は○○と異なる(大きい/小さい) モデル:𝑋𝑖 ~𝒩 𝜇, 𝜎 2 二標本の検定の帰無仮説・対立仮説の例 帰無仮説:標本𝑋の母平均と標本𝑌の母平均は等しい 対立仮説:標本𝑋の母平均と標本𝑌の母平均は異なる (大きい/小さい) モデル:𝑋𝑖 ~𝒩 𝜇𝑥 , 𝜎 2 , 𝑌𝑗 ~𝒩 𝜇𝑦 , 𝜎 2 269
検定統計量 一標本検定の検定統計量(𝒕値) 𝑋ത − 𝜇 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 𝑈2 ∙ 𝑚 二標本検定の検定統計量(𝒕値) 𝑋ത − 𝑌ത 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 1 2 𝑈𝑝𝑜𝑜𝑙 ∙ + 𝑚 𝑛 𝜇:帰無仮説で想定された母平均 ത 𝑋:標本Xの標本平均 ത 𝑌:標本Yの標本平均 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ 𝑈 2 :不偏分散 2 𝑈𝑝𝑜𝑜𝑙 :プールされた分散
検定統計量 一標本検定の自由度 𝑚−1 𝜇:帰無仮説で想定された母平均 ത 𝑋:標本Xの標本平均 ത 𝑌:標本Yの標本平均 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ 𝑈 2 :不偏分散 2 𝑈𝑝𝑜𝑜𝑙 :プールされた分散 二標本検定の自由度 𝑚+𝑛−2 正規母集団からの無作為標本ならば 𝒕値は上記の自由度の𝒕分布に従う
片側検定の場合の棄却域 標本から計算される𝑡値を𝑡𝑠𝑎𝑚𝑝𝑙𝑒 と記す 有意水準を𝛼とする 𝑡分布における100 1 − 𝛼 %点を𝑡1−𝛼 と記す 𝑡分布における100𝛼%点を𝑡𝛼 と記す 右片側検定の時の棄却域 𝑡1−𝛼 < 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 左片側検定の時の棄却域 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 < 𝑡𝛼 例えば5%有意水準なら𝛼 = 0.05である 右片側検定なら𝑡0.95 すなわち95%点を参照して棄却域を求める 左片側検定なら𝑡0.05 すなわち 5%点を参照して棄却域を求める 272
両側検定の場合の棄却域 両側検定の棄却域その① 𝑡値が正の時 𝑡1−𝛼 < 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 2 両側検定の棄却域その② 𝑡値が負の時 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 < 𝑡𝛼 2 例えば5%有意水準なら𝛼 = 0.05である 𝑡値が正なら𝑡0.975 すなわち97.5%点を参照して棄却域を求める 𝑡値が負なら𝑡0.025 すなわち 2.5%点を参照して棄却域を求める → 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 が2.5%点未満、あるいは97.5%より上なら 273 帰無仮説を棄却する
統計的仮説検定を利用する際の注意点 注意点その① 検定の非対称性 注意点その② モデルが想定している仮定について 注意点その③ 無理やり有意差を出そうとしていないか? 注意点その④ 有意差が出たことを過信していないか? 274
統計学 II 第15回:期末テスト
統計学の講義を終えて どちらが「良い」か どちらを選ぶべきだろう? 売上を増やすために、製品の宣伝をしよう! 宣伝に効果はないかな? やっぱり宣伝無し? そうだ、データ使おう! 宣伝をした時としなかった時で売上を比較 276
宣伝するべき? 売り上げ平均の比較 56 54 52 50 48 46 宣伝あり 宣伝の効果ありだ! 宣伝無し 本当かな? 277
宣伝するべき? 売り上げの差は小さい 売り上げ平均の比較 60 55 50 40 20 0 宣伝あり 宣伝無し グラフの原点を0にしたよ 278
宣伝するべき? 微差であっても、宣伝ありの方が売上が高い 売上はばらつくから、偶然そうなっただけかも 判断を間違う確率をコントロールしたいな そうだ、統計的仮説検定を使おう! 宣伝をした時としなかった時で売上を比較 279
宣伝するべき? 帰無仮説:宣伝あり・無しで売り上げの平均値は同じ 対立仮説:宣伝あり・無しで売り上げの平均値が異なる 有意水準5%で2標本の𝑡検定を実施 第一種の過誤(帰無仮説を誤って棄却)を 犯す確率を5%にコントロールする 280
宣伝するべき? 検定統計量が棄却域に含まれる→帰無仮説を棄却 宣伝の有無で、売上の平均値は有意に異なる 検定統計量が棄却域に含まれない→帰無仮説を棄却できない 売上の平均値が有意に異なるとは言えない →判断を保留する 判断保留は、決して悪いことではない 判断保留という結論もとても大切 281
宣伝するべき? 有意差があったのでヨシ! 統計的仮説検定の想定は満たされているかな? (正規母集団からの無作為標本、等) 分析が利用できるシチュエーションか チェックすることが必須 282
統計学の講義を終えて Step1:データを使おう! データを見てみよう! データを使ってみようと思えたら、大きな進歩! Step2:データを疑おう 色々な角度からデータを吟味しよう 区間推定や仮説検定など、データのばらつきを考慮した 分析方法の利用も検討しよう Step3:分析方法を疑おう 区間推定や仮説検定を実施する際に想定したことが ちゃんと満たされているのかチェックしよう やることがたくさんあって、少し大変? 283
面倒なことはパソコンにやってもらおう! プログラミング演習について 「統計学II」の講義の補講として プログラミング演習を実施(成績には一切影響なし) 日時: 場所: 内容:初等的な統計分析をPythonで実行 (記述統計・区間推定・仮説検定) 持ち物:自分のノートパソコン(要ネット接続) ※終了しました。来年度も実施したい プログラミングで、データ分析は簡単に! 参加希望者は馬場にメールしてください 284