統計学II-3

統計学 II-3 ・推測統計の導入・標本抽出・点推定・標本分布・区間推定・仮説検定 https://logics-of-blue.com/

https://logics-of-blue.com/

本資料について本資料の成り立ち馬場が担当する学部1年生向け統計学IIの講義資料抜粋統計学を初めて学ぶ、文系の学生が受講する想定本資料の取り扱いあくまでも、本来の講義資料の抜粋なので注意 (計算演習・講義内クイズ・前回講義の復習口頭での説明内容等は省略) SNSなどでスライドのスクショを張り付けるのは、避けてほしい (文脈がわからないと、誤った理解を促すため) 2

3.

本資料について本資料の使い方想定①：講義の受講者が復習に利用する想定②：未受講者が統計学入門資料として利用する ※想定②の場合は、下記参考文献も参照すること参考文献馬場真哉，2022，翔泳社『Pythonで学ぶあたらしい統計学の教科書第2版』倉田博史・星野崇宏，2009，新世社『入門統計解析』鈴木武・山田作太郎，1996，内田老鶴圃『数理統計学』 3

4.

本資料の範囲 10．統計的仮説検定の導入 11．統計的仮説検定の解釈 12．母平均に関する検定1 13．母平均に関する検定2 14．独立性の検定 15．期末テスト

5.

統計学 II 第10回：統計的仮説検定の導入

6.

内容 1．二項検定の初歩 2．母平均に関する𝒕検定の初歩 3．統計的仮説検定を利用する注意点 6

7.

二項検定の初歩 7

8.

内容 1．二項検定の初歩 2．二項分布 3．二項検定 8

9.

内容 1．二項検定の初歩 2．二項分布 3．二項検定 9

10.

二項検定の初歩統計的仮説検定とは（ざっくり） ⚫ データを使って判断のサポートをする手法 (あくまでサポートするだけなので注意) ⚫ 確率の考え方を使うのが特徴 ⚫ 単に「仮説検定」や「検定」と呼ぶこともある ⚫ 統計的仮説検定にはたくさんの手法があるデータや目的に合わせて手法を使い分ける二項検定統計的仮説検定の一種。母比率の検定と呼ぶこともある問題設定がイメージしやすいので、最初に紹介する色んな検定があるが、まずは二項検定を 10

11.

二項検定の初歩ここからの進め方ちゃんとした用語の定義などは、後ほど説明まずはざっくり検定の流れを説明 11

12.

二項検定の初歩ちょっと怪しい推論 SSR排出率が2％のガチャがある 10連ガチャを回しても、当たりキャラが出ない ↓ このガチャは当たりキャラが一人も入ってない。不正だ！ガチャで当たりが出ないことはよくあるよ今回の事例ガチャを回しても当たりが1回も出なかった →当たり率は2％とより小さいのではないだろうか？ →「当たり率が2％より小さい」と言えるかどうか調べる参考：ワンランク上を目指す人のためのPython実践活用ガイド(2022)．技術評論社第7章7-5節(馬場執筆箇所)

13.

二項検定の初歩帰無仮説・対立仮説帰無仮説：ガチャの当たり率は2％と等しい ○○は××と等しい対立仮説：ガチャの当たり率は2％より小さい ○○は××と異なる(大きい/小さい) 帰無仮説との矛盾の度合いを測ることで自分の主張したいことを支持する 13

14.

二項検定の初歩有意差意味の有る差正直、かなりあいまい「意味の有る差」ってなんだ「意味の無い差」ってなんだ 14

15.

二項検定の初歩 1％以上ずれてたら有意差ありってことにしようぜ～ 10連しか回さなかったら、当たり0％になる 1連しか回さなかったら、0％はよくあるそのやり方だと、回す数を減らすと有意差が出やすくなりそうだくっ…… 15

16.

二項検定の初歩じゃあ200連以上回して当たり0なら有意差ありってことにしとこうぜ！ 200連回して当たり0より、 2000連回して当たり1の方がひどくない？ 1億連回して、当たり1でも有意差無しだとちょっと違和感があるなくっ…… 16

17.

二項検定の初歩意外と難しい有意差の考え方統計的仮説検定では確率を計算して判断をサポートする →「仮に○○だと想定したら」という仮定をおいて確率を計算する確率を計算しよう 1. 「当たり率が本当に2％だとしたら」という仮定を置く (他にもいろいろな仮定があるが、後述) 2. 実際の結果、あるいはそれより極端な結果が発生する確率を計算する 17

18.

クイズ表が出る確率が2％のコインを 100回投げて、表が1回も出ない確率は？確率を計算しよう SSRの当たり率が2%のガチャを100回実行したとき、当たりが1回も出ない確率は？ ① 1%未満 ② 1～5% ③ 6～10% ④ 11～15%

19.

クイズ(回答) 表が出る確率が2％のコインを 100回投げて、表が1回も出ない確率は？確率を計算しよう SSRの当たり率が2%のガチャを100回実行したとき、当たりが1回も出ない確率は？ ① 1%未満 ② 1～5% ③ 6～10% ④ 11～15% 100回程度当たらなくても仕方ないよくあること

20.

クイズ(回答) 計算方法当たりが出る確率が2％ということは、はずれが出る確率は98％！ 98％で起こることが100回連続で起こる確率を計算 0.98 × 0.98 × 0.98 ×… 0.98 × 0.98 0.98を100回掛け合わせる答えはおよそ0.133なので13％ほど 20

21.

クイズ(回答) 計算方法当たりが出る確率が2％ということは、はずれが出る確率は98％！ 98％で起こることが100回連続で起こる確率を計算スマホの電卓機能を使って 0.98の100乗を計算すると一瞬 0.98 × 0.98 × 0.98 ×… 0.98 × 0.98 (期末テストではスマホ利用不可) 0.98を100回掛け合わせる答えはおよそ0.133なので13％ほど 21

22.

二項検定の初歩確率の閾値について SSRの当たり率が2%のガチャを100回実行したとき、当たりが1回も出ない確率はおよそ13% とりあえずこの確率が5％未満なら有意差ありってことにしとこうぜ(テキトー) 5％という数値には根拠がないが、経験的に5％という数値が多く使われるこの閾値を有意水準と呼ぶ 22

23.

二項検定の初歩確率の閾値について SSRの当たり率が2%のガチャを200回実行したとき、当たりが1回も出ない確率はおよそ1.8% かなり低い確率じゃんじゃあ有意差ありってことにしとこうかなんか雑だが、このように判断することはしばしば行われているようだ便利な判断基準だが、乱用には注意 23

24.

二項検定の初歩確率の閾値について SSRの当たり率が2%のガチャを200回実行したとき、当たりが1回も出ない確率はおよそ1.8% 98％で起こることが200回連続で起こる確率を計算 0.98 × 0.98 × 0.98 ×… 0.98 × 0.98 0.98を200回掛け合わせる答えはおよそ0.018なので1.8 ％ほど 24

25.

二項検定の初歩ひとまずの結論 SSRの当たり率が2%のガチャを100回実行したとき、当たりが1回も出ない確率はおよそ13% SSRの当たり率が2%のガチャを200回実行したとき、当たりが1回も出ない確率はおよそ1.8% SSRの当たり率が2%だと想定したとき、実際の結果、あるいはそれより極端な結果が発生する確率が5％未満なら、当たり率が2％とは違う(有意差あり)ってことにしておこう (この5％を有意水準と呼ぶ) (この5％という数値に根拠はない。1％などでもOK) (有意水準を1％にしたら、200回ガチャでも有意差無し)

26.

内容 1．二項検定の初歩 2．二項分布 3．二項検定 26

27.

二項分布確率の計算と二項分布前期で登場した二項分布を使って確率を計算する二項分布とは確率分布の1種。正規分布のようにパラメータを持っている →パラメータを変えることで、様々な確率分布を作れる二項分布の確率質量関数 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 パラメータは𝑛と𝜃の2つ 27

28.

二項分布二項分布のパラメータ𝜃, 𝑛の意味表が出る確率が𝜃であるコインを𝑛回投げた時、 𝑋回の表が出る確率 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 成功確率：𝜃 試行回数：𝑛 28

29.

二項分布二項分布に従う確率変数の期待値と分散(参考) 成功確率：𝜃 試行回数：𝑛 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 期待値 𝐸 𝑋 = 𝑛𝜃 分散 𝑉 𝑋 = 𝑛𝜃 1 − 𝜃 証明は少し難しいので省略（興味のある学生は https://logics-of-blue.com/stats-calc-note/ ）

https://logics-of-blue.com/stats-calc-note/

30.

二項分布確率を計算しよう(復習) 1. 「当たり率が本当に2％だとしたら」という仮定を置く 2. 実際の結果、あるいはそれより極端な結果が発生する確率を計算する今までと全く同じ確率の計算を二項分布を使ってもう一度行う 30

31.

二項分布今までの議論 SSR排出率が2％のガチャがあるでも、当たりキャラが出ない！ →「当たり率が2％より小さい」と言えるかどうか調べる二項分布を使って議論 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 パラメータ𝜃が「当たり率」である →「パラメータ𝜃が0.02より小さいと言えるか」を調べる二項検定はパラメータ𝜃がある特定の値と異なるかどうかを調べる

32.

二項分布二項分布で確率計算 SSRの当たり率が2%のガチャを100回実行したとき、当たりが1回も出ない確率はおよそ13% 数値を代入 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 Bin 0 100,0.02 = 𝑛−𝑥 0 ∙ 1 − 0.02 C ∙ 0.02 100 0 100−0 = 13% 「パラメータ𝜃が0.02だ」と考えて確率を計算 → 𝜃 = 0.02を代入ガチャを100回実行した → 𝑛 = 100を代入 1回も当たりが出なかった → 𝑋 = 0を代入 32

33.

二項分布二項分布で確率計算 SSRの当たり率が2%のガチャを200回実行したとき、当たりが1回も出ない確率はおよそ1.8% 数値を代入 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 Bin 0 200,0.02 = 𝑛−𝑥 0 ∙ 1 − 0.02 C ∙ 0.02 200 0 200−0 = 1.8% 「パラメータ𝜃が0.02だ」と考えて確率を計算 → 𝜃 = 0.02を代入ガチャを200回実行した → 𝑛 = 200を代入 1回も当たりが出なかった → 𝑋 = 0を代入 33

34.

内容 1．二項検定の初歩 2．二項分布 3．二項検定 34

35.

二項検定二項分布から見た二項検定母集団分布を二項分布だと考える二項分布からの単純ランダムサンプリングで「当たり回数」というデータが得られると考える二項検定は母集団分布のパラメータ𝜃がある特定の値と異なると言えるかどうかを調べるための手法だと言える 35

36.

二項検定とあるガチャを100回実行したとき…… 100回中、1回当たったよ！ 100回中、 3回も当たったよ！ 100回中、 1回も当たらない…… 母集団：知りたいと思っている集団全体 →今回の例では、無数のガチャ結果

37.

二項検定とあるガチャを100回実行したとき…… 1回も当たらない…… 標本：手に入れた一部のデータ →今回は1回も当たらなかったとする

38.

二項検定とあるガチャを100回実行したとき…… 3回当たった！たまたま「たくさん当たる」こともある

39.

二項検定とあるガチャを100回実行したとき…… 3回当たった！無数のガチャ結果からランダムに1回の結果を取得

40.

二項検定単純ランダムサンプリング 1回も当たらない…… 試行回数𝑛 = 100、成功確率𝜃 = 0.02の二項分布が母集団分布母集団についての仮定＋標本抽出の仮定を組み合わせたモデル 40

41.

二項検定確率を計算しよう 1. 「当たり率が本当に2%だとしたら」という仮定を置くさらに、母集団分布が二項分布であり、そこから単純ランダムサンプリングで標本が得られたという仮定を置く 2. 実際の結果、あるいはそれより極端な結果が発生する確率を計算するこの確率を𝑝値と呼ぶ SSRの当たり率が2%のガチャを100回実行したとき、当たりが1回も出ない確率はおよそ13% 𝑝値が有意水準(5％)以上なので差があるとは言えない →ガチャ不正の根拠を得ることはできなかった 41

42.

二項検定確率を計算しよう 1. 「当たり率が本当に2%だとしたら」という仮定を置くさらに、母集団分布が二項分布であり、そこから単純ランダムサンプリングで標本が得られたという仮定を置く 2. 実際の結果、あるいはそれより極端な結果が発生する確率を計算するこの確率を𝑝値と呼ぶ SSRの当たり率が2%のガチャを200回実行したとき、当たりが1回も出ない確率はおよそ1.8% 𝑝値が有意水準(5％)未満なので有意差ありと判断 →このガチャは不正だという理由付けの1つになる 42

43.

二項検定確率計算のおまけ例えば300回ガチャを実行して当たりが1つ出たとする →この場合は「当たりが1つ出る確率」とさらに極端である「当たりが1つも出ない確率」の合計値を利用する →これが「実際の結果、あるいはそれより極端な結果が発生する確率」の意味実際の計算は難しいので省略 43

44.

二項検定終わりに有意差の有無を判断するには、中間テストまでずっとやってきた「母集団」や「標本」などの議論が必要なんだな～というイメージは持ってほしいデータを入力して、即座に判断が「ポン」とできる便利な道具 ……というわけではないので注意 44

45.

二項検定で登場した用語など有意差意味の有る差メモ便宜的にこう呼ぶ帰無仮説・対立仮説帰無仮説の例：母集団のパラメータは××と等しい対立仮説の例：母集団のパラメータは××と異なる帰無仮説が棄却されたら「有意差あり」と判断する判断の流れ帰無仮説を想定したうえで、モデルを用いて、実際の結果や、より極端な結果が発生する確率を計算。その確率が「有意水準」を下回る場合には、帰無仮説を棄却して有意差ありと判断する。有意水準は5％がしばしば使われるが1％などでも良い

46.

母平均に関する𝒕検定の初歩二項検定とはまた異なる仮説検定の紹介詳細は２回後の講義で説明する初回講義ではおおざっぱな判断の流れを理解することを目指そう 46

47.

内容 1．統計的仮説検定の流れ 2．検定統計量 3．𝒑値 47

48.

内容 1．統計的仮説検定の流れ 2．検定統計量 3．𝒑値 48

49.

母平均に関する𝒕検定の初歩標本ある湖で魚Aを100尾釣った魚Aの体長の平均が約11cmだった魚A 疑問魚Aの母集団における平均体長は 10cmより大きいと言えるか？

50.

母平均に関する𝒕検定の初歩 1．母集団についての仮定を置く(正規母集団＋無作為標本) モデルを作る気温やエサの量など無数の要因で体長が変化したことを正規分布という「数理的表現」で置き換える『正規母集団から、単純ランダムサンプリングによって、標本が得られたというモデル』をこれから利用するデータから何かを判断する際に、仮定を置いていることを意識すること仮定を置くことで判断が楽になる 50

51.

母平均に関する𝒕検定の初歩単純ランダムサンプリング母集団分布は正規分布母集団についての仮定＋標本抽出の仮定 →この仮定を置いていることに注意 51

52.

母平均に関する𝒕検定の初歩 1．母集団についての仮定を置く(正規母集団＋無作為標本) 2．帰無仮説と対立仮説を設定する帰無仮説：母集団の平均体長は10cmと等しい ○○は××と等しい対立仮説：母集団の平均体長は10cmより大きい ○○は××と異なる(大きい/小さい) 帰無仮説との矛盾の度合いを測ることで自分の主張したいことを支持する 52

53.

母平均に関する𝒕検定の初歩 1．母集団についての仮定を置く(正規母集団＋無作為標本) 2．帰無仮説と対立仮説を設定する 3．有意水準を決定する 𝑝値がどれくらい小さい時に、帰無仮説を棄却するか決める多くの場合は0.05が使われる 53

54.

母平均に関する𝒕検定の初歩 1．母集団についての仮定を置く(正規母集団＋無作為標本) 2．帰無仮説と対立仮説を設定する 3．有意水準を決定する 4．検定統計量を求める(後述) 5． 𝑝値を計算して、 𝑝値が有意水準を下回るか調べる 54

55.

内容 1．統計的仮説検定の復習 2．検定統計量 3．𝒑値 55

56.

検定統計量今回は検定統計量として𝑡値を使う信頼区間の計算でも登場した指標 𝑡値が大きければ、有意差があるとみなせる 𝒕値と有意差の関係性は？ 56

57.

検定統計量平均体長が10cmよりも有意に大きいと言える条件は？案1：平均値が10cmから離れていたら、有意差あり青は有意差ありそう赤は有意差なさそう 10 ↓ データのばらつきも加味すべき 0 平均15 平均15 57

58.

検定統計量平均体長が10cmよりも有意に大きいと言える条件は？案2：平均値が10cmから離れ、ばらつきも小さい青は有意差ありそう赤は有意差なさそう 10 ↓ サンプルサイズも加味すべき 0 平均15 平均15 58

59.

検定統計量平均体長が10cmよりも有意に大きいと言える条件は？条件1：平均値が10から離れている条件2：ばらつき（不偏分散）が小さい条件3：サンプルサイズが大きい平均値 − 10 平均値の差 𝑡値＝ = 標準誤差分散 ÷ サンプルサイズ 𝑡値が大なら有意差ありと主張できそう 59

60.

内容 1．統計的仮説検定の復習 2．検定統計量 3．𝒑値 60

61.

𝒑値 𝑡値が大ならば、有意差がありそう「𝑡値が大きい」というのは、どのようにして判断する？例えば、𝑡値が３だったとして、その数値は大きい？小さい？「確率」に基づいて判断する確率を計算するときに、𝑡分布を使う 61

62.

𝒕値を「大きい」とみなすかどうかの判断標本の𝒕値が３の時、この𝑡値が大きいとみなせるか判断したい Step1 標本を、正規母集団から得られた無作為標本と想定母集団分布のパラメータとして、帰無仮説（母平均=10）が正しいと仮定 →このモデルでは、標本の𝑡値は𝑡分布に従う 62

63.

𝒕値を「大きい」とみなすかどうかの判断標本の𝒕値が３の時、この𝑡値が大きいとみなせるか判断したい Step1 標本を、正規母集団から得られた無作為標本と想定母集団分布のパラメータとして、帰無仮説（母平均=10）が正しいと仮定 →このモデルでは、標本の𝑡値は𝑡分布に従う 𝒕値 𝑡値＝標本の平均値 − 10 標本から計算された不偏分散 ÷ サンプルサイズ 63

64.

𝒕値を「大きい」とみなすかどうかの判断標本の𝒕値が３の時、この𝑡値が大きいとみなせるか判断したい Step1 標本を、正規母集団から得られた無作為標本と想定母集団分布のパラメータとして、帰無仮説（母平均=10）が正しいと仮定 →このモデルでは、標本の𝑡値は𝑡分布に従う Step2 このとき、偶然で𝑡値が３を超える確率を計算する →これが𝑝値 Step3 𝑝値が有意水準(今回は0.05)よりも小さければ、標本の𝑡値は十分大きいとみなせるので「有意差あり」と判断

65.

母平均に関する𝒕検定の初歩 1．母集団についての仮定を置く(正規母集団＋無作為標本) 2．帰無仮説と対立仮説を設定する 3．有意水準を決定する(今回は0.05) 4．検定統計量を求める(今回は𝑡値) 5． 𝑝値を計算して、 𝑝値が有意水準を下回るか調べる 65

66.

統計的仮説検定を利用する注意点 66

67.

統計的仮説検定を利用する注意点「絶対正しい」結果がわかるわけでは無い「絶対に母平均は10と異なる」といったことはわからない判断を間違える可能性もあるんだけど、「判断を間違える確率をコントロールしたい」という意図で用いる手法利用には細心の注意が必要 67

68.

統計的仮説検定を利用する注意点メモ 2つの過ち帰無仮説か対立仮説、どちらかが正しいはず第一種の過誤帰無仮説が正しいのに、誤って棄却してしまう第二種の過誤帰無仮説が間違っているのに、誤って採択してしまう統計的仮説検定では、第一種の過誤を犯す確率をコントロールすることを目指す 68

69.

統計的仮説検定を利用する注意点検定の非対称性第一種の過誤を心配 →第二種の過誤が起こる確率はコントロールしていない →2つの過ちの扱いは同じではない 𝑝値が有意水準以下ならば、帰無仮説を棄却するしかし、 𝑝値が有意水準より大きくても帰無仮説が正しいとは主張できない →検定の非対称性に注意例えば𝑝値=0.04で、有意水準0.05を下回った →母平均は10と有意に異なる例えば𝑝値=0.19で、有意水準を上回った →母平均が10と有意に異なるとは言えない「10と等しい」とは言えない 69

70.

統計的仮説検定を利用する注意点確率の計算の際には「モデル」を用いている • 母集団からの単純ランダムサンプリングという仮定 • 母集団分布が正規分布に従っているという仮定上記の仮定を置いたモデルを利用して、 𝒑値を計算している → モデルを間違えると「判断を間違える確率」を間違える「判断を間違える確率」を間違えると、もはやどうしようもない…… 70

71.

統計的仮説検定を利用する注意点 𝒑値とは大雑把に言うと「特定の統計モデルのもとで、データの統計的要約（たとえば2グループ比較での標本平均の差）が、観察された値と等しいか、それよりも極端な値を取る確率である」『統計的有意性と P 値に関する ASA 声明』より引用 https://www.biometrics.gr.jp/news/all/ASA.pdf 確率の計算には、モデルが必要モデルから得られた計算結果を利用 71

https://www.biometrics.gr.jp/news/all/ASA.pdf

72.

統計的仮説検定を利用する注意点統計的仮説検定が目指すこと母集団のパラメータが「ピッタリ10です」とはわからない →「10と異なるかどうか」を判断しよう（妥協１）「10と異なるかどうか」が完璧にはわからない →間違うことはあるけど、「第一種の過誤を犯す」確率はできる限りコントロールしよう（妥協２）でも、第一種の過誤を犯す確率も厳密には計算できないよね →単純なモデルを使って確率を計算しよう（妥協３）仮説検定は、便利ではあるものの、結果の解釈には細心の注意が必要 72

73.

統計的仮説検定を利用する注意点統計的仮説検定、難しいし制約が多いわからんでもない正直使いたくないわからんでもないだが、2022年12月現在、統計的仮説検定は様々な分野で頻繁に使われている。自分で使うかどうかは別としても、仮説検定の結果を自分で解釈する必要がある正しく使えば便利な手法でもある 73

74.

統計学 II 第11回：統計的仮説検定の解釈

75.

統計的仮説検定を利用する注意点統計的仮説検定、難しいわかる制約が多くて、使うのには細心の注意が必要その通りじゃあ使わない授業さぼるそうはいかぬ

76.

二項検定の初歩統計的仮説検定を学ぶとは 1．検定の手続きを学ぶ(用語が多くて大変) 2．検定の限界や利用の際の注意点を学ぶ実行できるようになるのが大変実行できるようになった後も大変じゃあなんでこんなものを学ぶのか 76

77.

内容 1．統計的仮説検定の利用例 2．統計的仮説検定の結果の解釈 3．統計的仮説検定の悪用と対策 77

78.

統計的仮説検定の利用例 78

79.

統計的仮説検定の利用例新型コロナウイルスのワクチン接種についてワクチンって本当に効果あるの？何回も打たなきゃいけないの？デルタ株やオミクロン株などいろいろあるけど効き目に違いがあるの？データから判断する必要性は高い 79

80.

統計的仮説検定の利用例新型コロナウイルスのワクチン接種について『ワクチン接種後約2ヶ月の時点で、88～100%の接種者が従来株、アルファ株およびデルタ株などの変異株に対して中和抗体を保有していましたが、オミクロン株に対する保有率は、わずか28%でした。一方、デルタ株などでは若年者では、高齢者より有意に高い中和抗体が誘導されていたものの、オミクロン株に対しては、若年者においても低い中和抗体価を示し、年齢差は認められませんでした。』引用：新型コロナウイルスmRNAワクチン接種により誘導されるオミクロン株に対する中和抗体 2022年12月4日最終閲覧 https://www.kobe-u.ac.jp/research_at_kobe/NEWS/collaborations/2022_02_01_02.html 80

https://www.kobe-u.ac.jp/research_at_kobe/NEWS/collaborations/2022_02_01_02.html

81.

統計的仮説検定の利用例新型コロナウイルスのワクチン接種について『ワクチン接種後約2ヶ月の時点で、88～100%の接種者が従来株、アルファ株およびデルタ株などの変異株に対して中和抗体を保有していましたが、有意の文字が！オミクロン株に対する保有率は、わずか28%でした。一方、デルタ株などでは若年者では、高齢者より有意に高い中和抗体が誘導されていたものの、オミクロン株に対しては、若年者においても低い中和抗体価を示し、年齢差は認められませんでした。』引用：新型コロナウイルスmRNAワクチン接種により誘導されるオミクロン株に対する中和抗体 2022年12月4日最終閲覧 https://www.kobe-u.ac.jp/research_at_kobe/NEWS/collaborations/2022_02_01_02.html 81

https://www.kobe-u.ac.jp/research_at_kobe/NEWS/collaborations/2022_02_01_02.html

82.

統計的仮説検定の利用例新型コロナウイルスのワクチン接種について先の報告では統計的仮説検定を利用して若年層と高齢層で違いがあるかどうかを調べた。他にも元論文を読むと様々な比較と統計的仮説検定が実施されているのがわかる (専門外の教員が間違った知識を伝えるわけにはいかないのでコロナに関する説明は本授業で行わない) 引用：新型コロナウイルスmRNAワクチン接種により誘導されるオミクロン株に対する中和抗体 2022年12月4日最終閲覧 https://www.kobe-u.ac.jp/research_at_kobe/NEWS/collaborations/2022_02_01_02.html 82

https://www.kobe-u.ac.jp/research_at_kobe/NEWS/collaborations/2022_02_01_02.html

83.

統計的仮説検定の利用例統計分析を行った後のいろいろな表記について CI(Confidence Interval)は信頼区間の意味代表値だけでなくCIも併記することが多い仮説検定の結果と区間推定の結果を併記することはしばしばある P=○○やp-value=○○という数値は統計的仮説検定を行った結果の𝑝値のこと統計的仮説検定といっても手法は様々ある (二項検定・母平均に関する𝑡検定、等々) どのような分析方法が利用されているかは、元の論文などをしっかり確認する必要がある仮説検定がわからないと論文が読めない！ 83

84.

統計的仮説検定の利用例品質管理と統計的仮説検定直径5mmのネジを作っている工場があるこのネジは本当に直径5mmになっているだろうか？平均すると4.8mmになっているのでは？ →ネジの直径が5mmと異なるかどうかの判断をしたい農業と統計的仮説検定肥料や生育条件によって作物の育ちが変わるのかどうかデータを使って判断したいデータから判断することは多い 84

85.

統計的仮説検定の解釈 85

86.

統計的仮説検定の解釈統計的仮説検定は、便利ではあるはいじゃあ「差がある」かどうか調べる場合は常に統計的仮説検定を使ったらいいねまぁ、よく使うんだけど「ご神託」とは違うので気を付けるように

87.

統計的仮説検定の解釈統計的仮説検定が目指すこと母集団のパラメータが「ピッタリ10です」とはわからない →「10と異なるかどうか」を判断しよう（妥協１）「10と異なるかどうか」が完璧にはわからない →間違うことはあるけど、「第一種の過誤を犯す」確率はできる限りコントロールしよう（妥協２）でも、第一種の過誤を犯す確率も厳密には計算できないよね →単純なモデルを使って確率を計算しよう（妥協３）先週も説明したがもう一度統計的仮説検定の解釈を復習 87

88.

統計的仮説検定の解釈解説の前提統計的仮説検定には様々な種類がある一般論を述べるとわかりにくいので「母平均に関する𝑡検定」を対象とする 88

89.

内容 1．母平均に関する𝒕検定の復習 2．検定の非対称性の復習 3．分析をする際に想定している仮定 89

90.

内容 1．母平均に関する𝒕検定の復習 2．検定の非対称性の復習 3．分析をする際に想定している仮定 90

91.

内容 1．母平均に関する𝒕検定の復習 2．検定の非対称性の復習 3．分析をする際に想定している仮定 91

92.

内容 1．母平均に関する𝒕検定の復習 2．検定の非対称性の復習 3．分析をする際に想定している仮定 92

93.

統計的仮説検定の悪用と対策 93

94.

内容 1．有意差はすべてを解決する！ 2．何が何でも有意な結果にしてやるぜ！ 3．黙っていれば、ばれないよ！ 94

95.

内容 1．有意差はすべてを解決する！ 2．何が何でも有意な結果にしてやるぜ！ 3．黙っていれば、ばれないよ！有意差の解釈についての注意点 95

96.

有意差の解釈 𝑝値が小さければ、このダイエット薬には効果があると言えるんや～有意差がありさえすれば、ダイエット薬を売って大金持ちになれるんや～やめて

97.

有意差の解釈 𝑝値が有意水準を下回れば有意か 𝑝値は小さいほうがいいんだなということは、 𝑝値が小さければ小さいほど差が大きいと言えるわけか全然ちがう

98.

有意差の解釈 𝑡検定では𝑡値を検定統計量に利用する 𝒕値の特徴条件1：平均値が10から離れている(10より大きい) 条件2：ばらつき(不偏分散)が小さい条件3：サンプルサイズが大きい平均値 − 10 平均値の差 𝑡値＝ = 標準誤差分散 ÷ サンプルサイズ差の大きさ、ばらつきの小ささサンプルサイズの大きさすべてを考慮！ 98

99.

有意差の解釈統計的仮説検定におけるよくある間違い 𝑝値が小さかったので差が大きいよ～ばらつきが小さかっただけかもサンプルサイズが大きかっただけかも基本的に、サンプルサイズが大きいと有意差は出やすくなる何はともあれ有意だったらそれでよくない？

100.

有意差の解釈このダイエット薬は、有意に体重を減らすよ！ 𝑝値はなんと驚愕の0.0001だ！！あるダイエット薬の効能評価 1万人を対象に調査した(サンプルサイズ大) 1g単位で計測したダイエット薬を飲むと、5％水準で有意に体重が減少したダイエット薬を飲んだ人と飲まない人の体重の差は平均して50g 50gだけ体重が減っても、見た目はほとんど変わらないよ

101.

有意差の解釈有意差の解釈の上での注意点① 有意差あり差が大きい有意差はサンプルサイズやデータのばらつきも考慮する逆に言えば、差が大きくても観測誤差が大きいだけかも有意差の解釈の上での注意点② 有意差あり私たちの生活に影響が有る「意味の有る差」という表現はあくまで便宜的なもの

102.

内容 1．有意差はすべてを解決する！ 2．何が何でも有意な結果にしてやるぜ！ 3．黙っていれば、ばれないよ！無理やり有意差を出す方法(悪用厳禁) 102

103.

有意差は簡単に出せる(悪用厳禁) どんな行為がダイエットに効くか知りたいな～データをたくさん集めるぜ～

104.

有意差は簡単に出せる(悪用厳禁) ダイエットに効く行動の調査(架空のデータ) ある行動をした/しなかった、場合で体重に有意差が出るかどうかを何度も検定有意差演奏パーティ釣りなしなしあり有意差見つけた～！アボカドを食べるなし

105.

有意差は簡単に出せる(悪用厳禁) ※架空の結果重大発表があります！なんと、釣りをしたら痩せる！やめてこの議論のどこが問題なのだろう？

106.

有意差は簡単に出せる(悪用厳禁) 統計的仮説検定を使う理由第一種の過誤(差がないという帰無仮説を間違って棄却) を犯す確率をコントロールするためモデルの前提などが正しく、有意水準を5％にしたなら、誤って「有意差あり」と言ってしまう確率は5％に抑えることができるはず釣りがダイエットに効くという主張が間違っている確率はたったの5％だ！実は、かなり難しい問題 106

107.

有意差は簡単に出せる(悪用厳禁) ダイエットに効く行動の調査(架空のデータ) ある行動をした/しなかった、場合で体重に有意差が出るかどうかを何度も検定演奏 5％の確率で誤って棄却パーティ釣りアボカドを食べる

108.

有意差は簡単に出せる(悪用厳禁) ダイエットに効く行動の調査(架空のデータ) ある行動をした/しなかった、場合で体重に有意差が出るかどうかを何度も検定演奏パーティ 5％の確率で誤って棄却釣りアボカドを食べる

109.

有意差は簡単に出せる(悪用厳禁) ダイエットに効く行動の調査(架空のデータ) ある行動をした/しなかった、場合で体重に有意差が出るかどうかを何度も検定演奏パーティ釣り 5％の確率で誤って棄却アボカドを食べる

110.

有意差は簡単に出せる(悪用厳禁) ダイエットに効く行動の調査(架空のデータ) ある行動をした/しなかった、場合で体重に有意差が出るかどうかを何度も検定演奏パーティ釣りアボカドを食べる 5％の確率で誤って棄却

111.

クイズ表が出る確率が5％のコインを 4回投げて、どれか1つでも表になる確率は？確率を計算しよう第一種の過誤を犯す確率が5％の仮説検定を 4回行い、どれか1つでも第一種の過誤が発生してしまう確率は？ ① 5% ② 15% ③ 19% ④ 24%

112.

クイズ(回答) 表が出る確率が5％のコインを 4回投げて、どれか1つでも表になる確率は？確率を計算しよう第一種の過誤を犯す確率が5％の仮説検定を 4回行い、どれか1つでも第一種の過誤が発生してしまう確率は？ ① 5% ② 15% ③ 19% ④ 24%

113.

クイズ(回答) 計算方法まずは1度も過ちを犯さない確率を計算する第一種の過誤を犯す確率が5％ということは、過ちを犯さない確率は95％ 95％で起こることが4回連続で起こる確率を計算 0.95 × 0.95 × 0.95 × 0.95 ≈ 0.815 4回連続過ちを犯さない確率は81.5% どれか1回でも過ちを犯す確率は1 − 0.815 = 0.185 なので大体19％ 113

114.

有意差は簡単に出せる(悪用厳禁) ダイエットに効く行動の調査(架空のデータ) ある行動をした/しなかった、場合で体重に有意差が出るかどうかを何度も検定演奏パーティ釣りアボカドを食べる 1回につき5％間違う検定を、4回連続で実施するとどれか1つが間違う確率は5％より大きくなる (19％くらい間違う) 何度も検定すると、どこかで間違う

115.

有意差は簡単に出せる(悪用厳禁) 仕方ない、検定の対象は1つだけにするかやばい、有意差が出なかった。効果なしか！？いや、まだいける！！だって、検定には複数の種類があるんだから！

116.

有意差は簡単に出せる(悪用厳禁) ダイエットに効く行動の調査(架空のデータ) 演奏をした/しなかった、場合で体重に有意差が出るかどうかを仮説検定で調べた手法有意差 𝑡検定無し 𝑈検定無し 𝑍検定有り有意差が出るまで検定の手法をひたすら替えるのは、もちろんダメ

117.

有意差は簡単に出せる(悪用厳禁) 様々なズル仮説検定の手法の切り替え以外にも (行うべきでない)有意差を出すズルはたくさんある例）変数変換：データを対数変換するなど (対数変換するべき時もあるが、悪用は厳禁) 一部のデータの排除逆に異常値をそのまま放置する自分が欲しい結果を得るために分析結果を改ざんしてはいけない！

118.

有意差は簡単に出せる(悪用厳禁) 有意差を無理やり出すことは避けよう統計的仮説検定は第一種の過誤を犯す確率をコントロールすることに努めた手法 →モデルの仮定が満たされている時など、うまく使えば、第一種の過誤を犯す確率は有意水準に抑えられる →「有意差を無理に出す」ということは、第一種の過誤を犯す確率のコントロールがもはや効かなくなってしまったということ

119.

内容 1．有意差はすべてを解決する！ 2．何が何でも有意な結果にしてやるぜ！ 3．黙っていれば、ばれないよ！仮説検定以外の結果も併記しよう！ 119

120.

黙っていれば、ばれないよ(ダメ) 唐突にひらめいた！ 4回の検定をしたと公表したから怒られたんだ有意差が出た仮説検定の結果だけを公表しようやめてデータ分析者としての倫理観の問題情報はなるべく開示するべき

121.

黙っていれば、ばれないよ(ダメ) 仮説検定の結果だけに頼るのは避けよう理由は思いつかないけど、有意差が出たから「釣りをすれば痩せる」と結論付けようやめて統計的仮説検定は判断のサポート役根拠をすべて仮説検定に任せるのは避ける

122.

黙っていれば、ばれないよ(ダメ) 判断の根拠はしっかりと開示する統計的仮説検定の結果(有意差の有無)だけを公表元データの情報(グラフも含む)も公表統計的仮説検定以外の根拠も述べる

123.

黙っていれば、ばれないよ(ダメ) 統計的仮説検定についての馬場の意見(個人の意見) 「統計的仮説検定には問題があるから使うな」は極端すぎる意見だと思う →代わりになる手法(情報量規準・ベイズ統計学など)も突き詰めればやはり利用者の問題がネックになる →「ずる」ができない手法は、多分無いと思う逆に「何が何でも仮説検定を実施すべきだ」も極端すぎる意見だと思う統計的仮説検定が果たす役割と統計的仮説検定が内在する課題を理解して過剰な期待はしないで使う 123

124.

統計学 II 第12回：母平均に関する検定1 (1標本問題)

125.

内容 1．母平均に関する𝒕検定の復習 2．棄却域の利用 3．片側検定と両側検定 4．計算演習 125

126.

母平均に関する𝒕検定の復習 126

127.

母平均に関する𝒕検定の復習標本ある湖で魚Aを100尾釣った魚Aの体長の平均が約11cmだった魚A 疑問魚Aの母集団における平均体長は 10cmより大きいと言えるか？

128.

母平均に関する𝒕検定の復習 1．母集団についての仮定を置く(正規母集団＋無作為標本) 128

129.

母平均に関する𝒕検定の復習単純ランダムサンプリング母集団分布は正規分布母集団についての仮定＋標本抽出の仮定 →この仮定を置いていることに注意 129

130.

母平均に関する𝒕検定の復習 1．母集団についての仮定を置く(正規母集団＋無作為標本) 2．帰無仮説と対立仮説を設定する帰無仮説：母集団の平均体長は10cmと等しい ○○は××と等しい対立仮説：母集団の平均体長は10cmより大きい ○○は××と異なる(大きい/小さい) 帰無仮説との矛盾の度合いを測ることで自分の主張したいことを支持する 130

131.

母平均に関する𝒕検定の復習 1．母集団についての仮定を置く(正規母集団＋無作為標本) 2．帰無仮説と対立仮説を設定する 3．有意水準を決定する 𝑝値がどれくらい小さい時に、帰無仮説を棄却するか決める多くの場合は0.05が使われる 131

132.

母平均に関する𝒕検定の復習 1．母集団についての仮定を置く(正規母集団＋無作為標本) 2．帰無仮説と対立仮説を設定する 3．有意水準を決定する 4．検定統計量を求める 132

133.

母平均に関する𝒕検定の復習平均体長が10cmよりも有意に大きいと言える条件は？条件1：平均値が10から離れている(10より大きい) 条件2：ばらつき(不偏分散)が小さい条件3：サンプルサイズが大きい平均値 − 10 平均値の差 𝑡値＝ = 標準誤差分散 ÷ サンプルサイズ 𝑡値が大なら有意差ありと主張できそう 133

134.

母平均に関する𝒕検定の復習 1．母集団についての仮定を置く(正規母集団＋無作為標本) 2．帰無仮説と対立仮説を設定する 3．有意水準を決定する 4．検定統計量を求める 5． 𝑝値を計算して、 𝑝値が有意水準を下回るか調べる 134

135.

母平均に関する𝒕検定の復習 𝑡値が大ならば、有意差がありそう「𝑡値が大きい」というのは、どのようにして判断する？例えば、𝑡値が３だったとして、その数値は大きい？小さい？「確率」に基づいて判断する確率を計算するときに、𝑡分布を使う 135

136.

母平均に関する𝒕検定の復習標本の𝒕値が３の時、この𝑡値が大きいとみなせるか判断したい Step1 標本を、正規母集団から得られた無作為標本と想定母集団分布のパラメータとして、帰無仮説（母平均=10）が正しいと仮定 →このモデルでは、標本の𝑡値は𝑡分布に従う 136

137.

母平均に関する𝒕検定の復習標本の𝒕値が３の時、この𝑡値が大きいとみなせるか判断したい Step1 標本を、正規母集団から得られた無作為標本と想定母集団分布のパラメータとして、帰無仮説（母平均=10）が正しいと仮定 →このモデルでは、標本の𝑡値は𝑡分布に従う 𝒕値 𝑡値＝標本の平均値 − 10 標本から計算された不偏分散 ÷ サンプルサイズ 137

138.

母平均に関する𝒕検定の復習標本の𝒕値が３の時、この𝑡値が大きいとみなせるか判断したい Step1 標本を、正規母集団から得られた無作為標本と想定母集団分布のパラメータとして、帰無仮説（母平均=10）が正しいと仮定 →このモデルでは、標本の𝑡値は𝑡分布に従う Step2 このとき、偶然で𝑡値が３を超える確率を計算する →これが𝑝値 Step3 𝑝値が有意水準(今回は0.05)よりも小さければ、標本の𝑡値は十分大きいとみなせるので「有意差あり」と判断

139.

母平均に関する𝒕検定の復習最終判断 𝑝値が有意水準を下回った →帰無仮説を棄却する →母平均は有意に10より大きいと報告する 𝑝値が有意水準を上回った →帰無仮説を棄却できない →母平均は有意に10より大きいとは言えないと報告する (「母平均は10と等しい」と言ってはいけない) 139

140.

棄却域の利用手計算でも𝒕検定を実行できる簡便な方法を紹介 140

141.

棄却域の利用 𝒑値の計算は大変 𝑝値を求めるためには𝑡分布を用いた確率計算が必要 →これを手計算で行うのはすごく大変 𝒕分布のパーセント点の利用区間推定の時のように、 𝑡分布のパーセント点の表を利用して統計的仮説検定を行う方法を検討する 141

142.

棄却域の利用棄却域・受容域帰無仮説を棄却するか否かを判断するために用いられる検定統計量の範囲検定統計量が棄却域に含まれる →帰無仮説を棄却する検定統計量が受容域に含まれる →帰無仮説を棄却しない 142

143.

棄却域の利用棄却域・受容域の求め方検定統計量が棄却域に入るならば帰無仮説を棄却するこの時、第一種の過誤を犯す確率が有意水準に抑えられるようにする必要がある有意水準と𝑡分布のパーセント点を参照することで棄却域・受容域を求める 143

144.

パーセント点の復習 𝒕分布から計算できる％点確率変数𝑌が「ある値𝑡𝛼 」以下となる確率が100𝛼％である → 𝑃 𝑌 ≤ 𝑡𝛼 = 𝛼 →このような𝑡𝛼 のことを「100𝛼％点」と呼ぶ例） 𝛼 = 0.05の場合𝑃 𝑌 ≤ 𝑡0.05 = 0.05となる 𝑡0.05 は5％点 𝛼 = 0.025の場合𝑃 𝑌 ≤ 𝑡0.025 = 0.025となる 𝑡0.025 は2.5％点自由度(サンプルサイズから求まる)さえ決めれば、機械的に計算可能 144

145.

パーセント点の復習 𝒕分布から計算できる％点（自由度が4の時）確率変数𝑌が「ある値𝑡𝛼 」以下となる確率が100𝛼％である → 𝑃 𝑌 ≤ 𝑡𝛼 = 𝛼 →このような𝑡𝛼 のことを「100𝛼％点」と呼ぶ例） 𝛼 = 0.05の場合𝑃 𝑌 ≤ 𝑡0.05 = 0.05となる 𝑡0.05 は5％点𝑡0.05 ≈ −2.132 𝛼 = 0.025の場合𝑃 𝑌 ≤ 𝑡0.025 = 0.025となる 𝑡0.025 は2.5％点𝑡0.025 ≈ −2.776 大体の統計分析ソフトウェアを使えば、この程度の計算は簡単にできる 145

146.

パーセント点の復習 𝒕分布から計算できる％点色々（自由度が4の時）参考（覚えなくていい）２．５％点 𝑡0.025 ≈ −2.776 𝑡0.05 ≈ −2.132 ５％点１０％点５０％点９０％点 𝑡0.1 ≈ −1.533 𝑡0.5 = 0 𝑡0.9 ≈ 1.533 ←５０％点＝中央値９５％点 𝑡0.95 ≈ 2.132 ９７．５％点 𝑡0.975 ≈ 2.776 146

147.

パーセント点の復習自由度4の𝒕分布の％点

148.

パーセント点の復習自由度4の𝒕分布の％点 𝑡0.9 ≈ 1.553 𝑡0.9 以下になる確率は90％

149.

パーセント点の復習自由度4の𝒕分布の％点 𝑡0.9 ≈ 1.553 𝑡0.9 以上になる確率は10％

150.

パーセント点の復習自由度4の𝒕分布の％点 𝑡0.95 以下になる確率は95％ 𝑡0.95 ≈ 2.132

151.

パーセント点の復習自由度4の𝒕分布の％点 𝑡0.95 以上になる確率は5％ 𝑡0.95 ≈ 2.132

152.

パーセント点の復習自由度4の𝒕分布の％点 𝑡0.975 ≈ 2.776 𝑡0.975 以下になる確率は97.5％

153.

パーセント点の復習自由度4の𝒕分布の％点 𝑡0.975 ≈ 2.776 𝑡0.975 以上になる確率は2.5％

154.

棄却域の利用 𝑡値が大ならば、有意差がありそう「𝑡値が大きい」というのは、どのようにして判断する？例えば、𝑡値が３だったとして、その数値は大きい？小さい？「確率」に基づいて判断する確率を計算するときに、𝑡分布を使う棄却域を使って判断を下す 154

155.

棄却域の利用棄却域とパーセント点正規母集団からの無作為標本を想定したとき、 𝑡値が棄却域に含まれるならば帰無仮説を棄却する →誤って帰無仮説を棄却する確率は有意水準(5％)に抑えたい自由度4の𝒕分布のパーセント点 𝑡0.95 ≈ 2.132 もしもサンプルサイズ5の標本において 𝑡値2.132だったとする。 𝑡値が2.132を上回る確率は5％となる 𝑡値が95％点、すなわち2.132よりも大きいときに帰無仮説を棄却すればOK 155

156.

棄却域の利用棄却域を使った𝒕検定(もう少し厳密に) 標本から計算される𝑡値を𝑡𝑠𝑎𝑚𝑝𝑙𝑒 と記す有意水準を𝛼とする 𝑡分布における100 1 − 𝛼 ％点を𝑡1−𝛼 と記す棄却域は以下の範囲を取る 𝑡1−𝛼 < 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 が棄却域に含まれるならば、帰無仮説を棄却する例えば5％有意水準なら𝛼 = 0.05なので 𝑡0.95 すなわち95％点を参照して棄却域を求める → 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 が95％点を超えていたら帰無仮説を棄却する 156

157.

片側検定と両側検定棄却域や𝒑値を求める際の注意点 157

158.

内容 1．片側検定 2．両側検定 158

159.

内容 1．片側検定 2．両側検定 159

160.

片側検定 2．帰無仮説と対立仮説を設定する帰無仮説：母集団の平均体長は10cmと等しい ○○は××と等しい対立仮説：母集団の平均体長は10cmより大きい ○○は××より大きい今回は母平均が10より「大きい」かということだけを調べた 160

161.

片側検定 2．帰無仮説と対立仮説を設定する帰無仮説：母集団の平均体長は10cmと等しい ○○は××と等しい対立仮説：母集団の平均体長は10cmより小さい ○○は××より小さい母平均が10より「小さい」かということを調べることも可能 161

162.

片側検定右片側検定「○○は××より大きい」を対立仮説にする (小さいことは考慮しない) 左片側検定「○○は××より小さい」を対立仮説にする (大きいことは考慮しない) 2つの片側検定を想定できるどちらを使うかは、分析の目的次第 162

163.

片側検定帰無仮説：母集団の平均体長は10cmと等しい 𝑡値＝標本の平均値 − 10 標本から計算された不偏分散 ÷ サンプルサイズ右片側検定の時に考慮する𝒕値標本平均が10cmより大きいなら、 𝑡値は0以上をとる左片側検定の時に考慮する𝒕値標本平均が10cmより小さいなら、 𝑡値は0以下をとる 163

164.

メモ片側検定標本から計算される𝑡値を𝑡𝑠𝑎𝑚𝑝𝑙𝑒 と記す有意水準を𝛼とする 𝑡分布における100 1 − 𝛼 ％点を𝑡1−𝛼 と記す 𝑡分布における100𝛼％点を𝑡𝛼 と記す右片側検定の時の棄却域 𝑡1−𝛼 < 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 左片側検定の時の棄却域 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 < 𝑡𝛼 例えば5％有意水準なら𝛼 = 0.05である右片側検定なら𝑡0.95 すなわち95％点を参照して棄却域を求める左片側検定なら𝑡0.05 すなわち 5％点を参照して棄却域を求める 164

165.

片側検定 𝒕分布から計算できる％点色々（自由度が4の時）参考（覚えなくていい）２．５％点 𝑡0.025 ≈ −2.776 𝑡0.05 ≈ −2.132 ５％点１０％点５０％点９０％点 𝑡0.1 ≈ −1.533 𝑡0.5 = 0 𝑡0.9 ≈ 1.533 ←５０％点＝中央値９５％点 𝑡0.95 ≈ 2.132 ９７．５％点 𝑡0.975 ≈ 2.776 165

166.

内容 1．片側検定 2．両側検定 166

167.

両側検定 2．帰無仮説と対立仮説を設定する帰無仮説：母集団の平均体長は10cmと等しい ○○は××と等しい対立仮説：母集団の平均体長は10cmと異なる ○○は××と異なる小さいか大きいかは気にしない異なるかどうかを調べるのが両側検定 167

168.

両側検定帰無仮説：母集団の平均体長は10cmと等しい 𝑡値＝標本の平均値 − 10 標本から計算された不偏分散 ÷ サンプルサイズ標本平均が帰無仮説と比べて大きいとき標本平均が10cmより大きいなら、 𝑡値は0以上をとる標本平均が帰無仮説と比べて小さいとき標本平均が10cmより小さいなら、 𝑡値は0以下をとる 168

169.

両側検定大きな𝑡値(大きな標本平均)が得られたぞ小さな𝑡値(小さな標本平均)が得られた時のことも考えましょう小さな𝑡値(小さな標本平均)が得られたぞ大きな𝑡値(大きな標本平均)が得られた時のことも考えましょう両方考える、両側検定

170.

メモ両側検定両側検定の棄却域その① 𝑡値が正(標本平均が帰無仮説より大きかった)の時 𝑡1−𝛼 < 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 2 両側検定の棄却域その② 𝑡値が負(標本平均が帰無仮説より小さかった)の時 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 < 𝑡𝛼 2 例えば5％有意水準なら𝛼 = 0.05である 𝑡値が正なら𝑡0.975 すなわち97.5％点を参照して棄却域を求める 𝑡値が負なら𝑡0.025 すなわち 2.5％点を参照して棄却域を求める → 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 が2.5％点未満、あるいは97.5%より上なら 170 帰無仮説を棄却する

171.

両側検定の補足便利な計算方式 𝑡分布は0を中心に左右対称なので両側検定の棄却域は一般的に以下のように書くことができる 𝑡1−𝛼 < 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 2 パーセント点の書き方も2通り 𝑡分布は0を中心に左右対称なので以下が成り立つどちらの記号で覚えても結果は変わらない 𝑡1−𝛼 = −𝑡𝛼 2 2 𝑡1−𝛼 = −𝑡𝛼 171

172.

両側検定の補足信頼区間を「仮説検定の逆」と導入する教科書もある仮説検定と区間推定棄却域の計算と、信頼区間の計算はよく似ている実際に、密接な関係がある母平均の95％信頼区間が帰無仮説を含んでいるなら有意水準5％の両側検定では帰無仮説を棄却できない母平均の95％信頼区間が帰無仮説を含まないなら有意水準5％の両側検定では帰無仮説を棄却できる統計的仮説検定と同じ結果を、信頼区間を使って得ることもできる 172

173.

計算演習 173

174.

検定の補足検定の補足（母分散が既知の場合）ほかの教科書などでは「母分散が既知の場合」と「母分散が未知の場合」で場合分けをしたうえで母平均に関する仮説検定を行うことがある →現実的に「母分散が既知」というシチュエーションはありえないので、今回の講義では省略した母分散𝜎 2 が既知の場合は𝑡値の代わりに𝑧値を使う 𝑡値 = 𝑋ത − 𝜇 𝑈 2ൗ 𝑛 𝑋ത − 𝜇 = 𝑆𝐸 𝑧値 = 𝑋ത − 𝜇 𝜎 2ൗ 𝑛 174

175.

検定の補足 𝑧値 = 𝑋ത − 𝜇 𝜎 2ൗ 𝑛 検定の補足（母分散が既知の場合）標本抽出のモデルを利用すると 𝑧値は標準正規分布に従うことが証明できる標準正規分布は、平均0、分散1の正規分布自由度などは考慮しなくてもOK →計算がちょっと簡単になる →でも、利用できるシチュエーションはほぼ存在しない 175

176.

検定の補足 𝑧値 = 𝑋ത − 𝜇 𝜎 2ൗ 𝑛 検定の補足（母分散が既知の場合）自由度が無限である𝑡分布は標準正規分布と一致する →サンプルサイズが増えると、 𝑡分布と標準正規分布のどちらを使っても、計算結果はほとんど変わらない →とはいえ、標準正規分布を使う積極的な理由もない 176

177.

統計学 II 第13回：母平均に関する検定2 (2標本問題)

178.

母平均に関する𝒕検定(今までの課題) 標本ある湖で魚Aを100尾釣った魚Aの体長の平均が約11cmだった魚A 疑問魚Aの母集団における平均体長は 10cmと異なると言えるか？

179.

母平均に関する𝒕検定(これからの課題) 標本ある湖で魚Xを100尾、と魚Yを80尾釣った魚Xの体長の平均が約11cmだった魚Yの体長の平均が約 8cmだった魚X 魚Y 疑問魚Xの体長の母平均と魚Yの母平均は異なると言えるか？

180.

内容 1．対応のあるt検定 2．分散が等しい場合の二標本検定 3．分散が等しくない場合の二標本検定全ての説明では母分散未知と想定 (母分散が既知の時の説明は省略) 180

181.

対応のあるt検定先週行った1標本の検定とほぼ同じ！ 181

182.

内容 1．問題設定 2．検定のやり方 182

183.

内容 1．問題設定 2．検定のやり方 183

184.

問題設定ダイエット薬を作ったよ！ごまかし無し！効果があると言えるか、検定しようか薬を飲む前薬を飲んだ後山田さん 55kg 45kg 田中さん 50kg 45kg 佐藤さん 62kg 58kg 184

185.

問題設定家庭教師を始めたよ！みんな成績UPだ！効果があると言えるか、検定しようか講義をする前講義をした後山田さん 70点 72点田中さん 80点 78点佐藤さん 90点 90点 185

186.

問題設定対応のある場合「対応がある」とは、例えば同じ人を対象にした時など目指すこと「対応がある」対象同士で変化があったかどうかを調べる

187.

内容 1．問題設定 2．検定のやり方以下ではすべて、データが、正規母集団からの無作為標本であると想定する 187

188.

検定のやり方ダイエット薬の効果は？ Step1：薬を飲む前と飲んだ後で体重の差分を取る薬を飲む前薬を飲んだ後山田さん 55kg 45kg 田中さん 50kg -10 45kg -5 佐藤さん 62kg 58kg -4 188

189.

検定のやり方ダイエット薬の効果は？ Step1：薬を飲む前と飲んだ後で体重の差分を取る -10, -5, -4 Step2：上記の差分値に対して「母平均が0と異なるかどうか」の検定を実施有意に0と異なる有意に0と異なるとは言えない有意な効果が認められた（もちろん過信は禁物だが）有意な効果が認められなかった 189

190.

検定のやり方家庭教師の効果は？ Step1：講義をする前とした後で点数の差分を取る講義をする前山田さん 70点田中さん 80点講義をした後 +2 72点 78点 -2 佐藤さん 90点 90点 0 190

191.

検定のやり方家庭教師の効果は？ Step1：講義をする前とした後で点数の差分を取る 2, -2, 0 Step2：上記の差分値に対して「母平均が0と異なるかどうか」の検定を実施有意に0と異なる有意に0と異なるとは言えない有意な効果が認められた（もちろん過信は禁物だが）有意な効果が認められなかった 191

192.

分散が等しい場合の二標本検定 192

193.

分散が等しい場合の二標本検定標本ある湖で魚Xを3尾、と魚Yを2尾釣った魚Xと魚Yの体長の母平均に差があるか調べたいただし魚Xと魚Yはともに分散が等しい正規母集団からの無作為標本であると想定する魚X 魚Y 疑問魚Xの体長の母平均と魚Yの母平均は異なると言えるか？

194.

問題設定分散が等しい場合の二標本検定「母平均」については等しいかどうか不明 →だから検定を行って調べる「母分散」については等しいと想定 →同じ湖にいるのだから、分散は等しいと言えるだろう？対応関係について 2種類の別の魚を対象にしている各々のサンプルサイズは異なるお互いの標本に対応関係はない

195.

分散が等しい場合の二標本検定一標本検定の場合の𝒕値 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 ＝標本の平均値 − 帰無仮説の母平均の値標本から計算された不偏分散 ÷ サンプルサイズ二標本検定の場合の𝒕値 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 魚𝑋の標本平均 − 魚𝑌の標本平均プールされた分散 × 1 1 + 𝑋のサンプルサイズ 𝑌のサンプルサイズこの数式を解読しよう！

196.

分散が等しい場合の二標本検定 ത 𝑋:標本Xの標本平均 ത 𝑌:標本Yの標本平均 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ一標本の場合の不偏分散 𝑚 𝑈2 1 = ෍ 𝑋𝑖 − 𝑋ത 𝑚−1 2 𝑖=1 二標本検定の場合のプールされた分散 𝑚 2 𝑈𝑝𝑜𝑜𝑙 1 = ෍ 𝑋𝑖 − 𝑋ത 𝑚+𝑛−2 𝑖=1 𝑛 2 + ෍ 𝑌𝑗 − 𝑌ത 2 𝑗=1 ※「プールする」とは「混ぜ合わせる」「一緒にする」くらいの意味

197.

分散が等しい場合の二標本検定一標本検定の場合の𝝌𝟐 値 𝑛−1 2 𝑈 2 𝜎 𝜎 2 :母分散(標本X,Yで共通) 母分散の影響をなくすために変換(𝝌𝟐 値のようなもの) 𝑚+𝑛−2 2 𝑈𝑝𝑜𝑜𝑙 2 𝜎 プールされた分散を変換したものは 2 自由度𝑚 + 𝑛 − 2の𝜒 分布に従う

198.

分散が等しい場合の二標本検定一標本検定の場合の標準誤差(𝒕値の分母) 𝑈2 1 ∙ 𝑚 二標本検定の場合の𝒕値の分母 2 𝑈𝑝𝑜𝑜𝑙 1 1 ∙ + 𝑚 𝑛 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ

199.

分散が等しい場合の二標本検定一標本検定の場合の𝒕値 𝑋ത − 𝜇 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 𝑈2 ∙ 𝑚 𝜇:帰無仮説で想定された母平均 ത 𝑋:標本Xの標本平均 ത 𝑌:標本Yの標本平均 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ二標本検定の場合の𝒕値 𝑋ത − 𝑌ത 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 1 2 𝑈𝑝𝑜𝑜𝑙 ∙ + 𝑚 𝑛 二標本検定の場合の𝑡値は自由度𝑚 + 𝑛 − 2の𝑡分布に従う

200.

分散が等しい場合の二標本検定一標本検定の場合の𝒕値 𝑋ത − 𝜇 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 𝑈2 ∙ 𝑚 二標本検定の場合の𝒕値 𝑋ത − 𝑌ത − 0 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 1 2 𝑈𝑝𝑜𝑜𝑙 ∙ + 𝑚 𝑛 𝜇:帰無仮説で想定された母平均 ത 𝑋:標本Xの標本平均 ത 𝑌:標本Yの標本平均 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ今回の帰無仮説は、「標本X,Y」で母平均に差がない

201.

分散が等しい場合の二標本検定一標本検定の場合の𝒕値 𝑋ത − 𝜇 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 𝑈2 ∙ 𝑚 二標本検定の場合の𝒕値 𝑋ത − 𝑌ത − 5 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 1 2 𝑈𝑝𝑜𝑜𝑙 ∙ + 𝑚 𝑛 𝜇:帰無仮説で想定された母平均 ത 𝑋:標本Xの標本平均 ത 𝑌:標本Yの標本平均 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズこの時の帰無仮説は、「標本X,Y」で標本YはXよりも母平均が5大きい(参考)

202.

検定の手順の復習(参考) 先週の復習棄却域・片側検定・両側検定 202

203.

計算演習 203

204.

分散が等しくない場合の二標本検定計算演習は無しただし、実務では頻繁に使うコンピュータで計算するのがほぼ必須 204

205.

分散が等しくない場合の二標本検定標本ある湖で魚Xを3尾、と魚Yを2尾釣った魚Xと魚Yの体長の母平均に差があるか調べたいただし魚Xと魚Yは分散が等しくない正規母集団からの無作為標本であると想定する魚X 魚Y 疑問魚Xの体長の母平均と魚Yの母平均は異なると言えるか？

206.

分散が等しくない場合の二標本検定一標本検定の場合の𝒕値 𝑋ത − 𝜇 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 𝑈2 ∙ 𝑚 𝜇:帰無仮説で想定された母平均 ത 𝑋:標本Xの標本平均 ത 𝑌:標本Yの標本平均 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ 𝑈𝑥2 :標本Xの不偏分散 𝑈𝑦2 :標本Yの不偏分散二標本検定の場合の𝒕値(分散が等しくない場合) 𝑋ത − 𝑌ത 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 2 𝑈𝑥2 𝑈𝑦 + 𝑚 𝑛

207.

分散が等しくない場合の二標本検定自由度 𝑈𝑥2 Τ𝑚 𝑈𝑥2 Τ𝑚 2 𝑚−1 2 2 Τ + 𝑈𝑦 𝑛 + 2Τ 2 𝑈𝑦 𝑛 𝑛−1 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ 𝑈𝑥2 :標本Xの不偏分散 𝑈𝑦2 :標本Yの不偏分散この方法をWelchの検定と呼ぶ自由度が小数点以下の値をとる →数表を見て棄却域を調べるのが困難

208.

統計学 II 第14回：独立性の検定・後期のまとめ

209.

内容 1．クロス集計表 2．独立性の検定 3．後期のまとめ 209

210.

クロス集計表 210

211.

クロス集計表 1．クロス集計表の基本 2．クロス集計表を使うべきとき 211

212.

クロス集計表 1．クロス集計表の基本 2．クロス集計表を使うべきとき 212

213.

度数分布度数ある属性に属するデータの数のこと度数分布属性と度数を対応させたもの度数分布表度数分布を表にしたものどんなデータが、何個あったかを数える 213

214.

度数分布度数分布表の例：受講者の学科の構成 25人へのアンケート結果（生データ）経済学科・経済学科・経済学科・経済学科・経済学科経済学科・経済学科・経済学科・経済学科・経済学科国際経済学科・国際経済学科・国際経済学科・国際経済学科・国際経済学科経営学科・経営学科・経営学科・経営学科・経営学科・経営学科・経営学科観光経営学科・観光経営学科・観光経営学科度数分布表属性（学科）度数経済学科 10 国際経済学科 5 経営学科 7 観光経営学科 3

215.

度数分布度数分布表の例：受講者の学科の構成合計：25人属性（学科）度数経済学科 10 国際経済学科 5 経営学科 7 観光経営学科 3 合計：25人度数分布表の例：受講者の年齢構成属性（年齢）度数 18歳 16 19歳 7 20歳 21歳 1 1

216.

クロス集計表クロス集計表カテゴリーごとの度数を記録した表ただし、通常の度数分布表と異なり「変数の組み合わせ」で度数を記録する 216

217.

クロス集計表合計：25人普通の度数分布表属性（学科）経済学科 2022年入学国際経済学科経営学科観光経営学科度数 10 5 7 3 合計：25人 2021年入学属性（学科）経済学科 5 国際経済学科 2 経営学科 13 観光経営学科 5 度数 217

218.

クロス集計表クロス集計表学科経済学科国際経済学科経営学科観光経営学科入学年度 2022年 2021年 10 5 5 7 2 13 3 5 年度による学科の違いが、クロス集計表を使えば一目でわかる 218

219.

クロス集計表生データをクロス集計表へ生のアンケートデータ学科経済学科入学年度 2022年度経済学科経営学科経営学科 2021年度 2022年度 2022年度・・・以下略学科と入学年度の2つの属性をアンケート 2つの属性の組み合わせで集計する 219

220.

クロス集計表クロス集計表学科 2022年度入学かつ、経済学科所属は10人経済学科国際経済学科経営学科観光経営学科入学年度 2022年 2021年 10 5 5 7 2 13 3 5 学科と入学年度の2つの属性をアンケート 2つの属性の組み合わせで集計する 220

221.

クロス集計表 1．クロス集計表の基本 2．クロス集計表を使うべきとき 221

222.

クロス集計表クロス集計表を使うべきタイミングナマズは地震予知ができるか？！地震あり暴れた 20 ナマズの行動暴れていない 2 ナマズが暴れたら、地震が発生する！？ ……何かデータが足りていない気がする 222

223.

クロス集計表クロス集計表を使うべきタイミングナマズは地震予知ができるか？！地震の有無地震あり地震なし暴れた 20 ？ナマズの行動暴れていない 2 ？地震が発生した時の度数だけを記録 →地震が発生しない時のデータが無い 223

224.

クロス集計表クロス集計表を使うべきタイミングナマズは地震予知ができるか？！地震の有無地震あり地震なし暴れた 20 200 ナマズの行動暴れていない 2 20 ナマズは常に暴れているナマズを見て地震を予知するのは難しい 224

225.

クロス集計表よくある間違い全ての犯罪者は、普段の生活でお水を飲んでいた！ ↓ だから、お水を飲む人は犯罪者だ！！！水を飲んだか飲む飲まない犯罪の有無犯罪あり犯罪なし 10 10000 0 0 225

226.

クロス集計表よくある間違い全ての犯罪者は、普段の生活でお水を飲んでいた！ ↓ 「犯罪あり」の列だけを見てはいけないだから、お水を飲む人は犯罪者だ！！！水を飲んだか飲む飲まない犯罪の有無犯罪あり犯罪なし 10 10000 0 0 226

227.

クロス集計表よくある間違い全ての犯罪者は、普段の生活でお水を飲んでいた！ ↓ だから、お水を飲む人は犯罪者だ！！！水を飲んだか飲む飲まない犯罪の有無犯罪あり犯罪なし 10 10000 0 0 犯罪を犯していない人のデータも大事全人類、水は飲む 227

228.

独立性の検定先ほどの議論を統計的仮説検定を用いて再検討 228

229.

内容 1．2つの変数が独立であるとき 2．期待度数 3．独立性の検定 229

230.

内容 1．2つの変数が独立であるとき 2．期待度数 3．独立性の検定 230

231.

確率変数の独立(復習) 確率変数の独立すべての𝑖, 𝑗で下記が成立するとき、確率変数𝑋, 𝑌が独立であると呼ぶ 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 ∙ 𝑃 𝑌 = 𝑦𝑗 これは、以下と実質同じ意味 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 = 𝑃 𝑌 = 𝑦𝑗 クロス集計表において独立性を検討 231

232.

ナマズと地震予知地震の有無 𝑌 地震あり地震なし 20 ナマズの行動暴れた 𝑋 暴れていない 2 合計 22 200 20 220 合計 220 22 242 232

233.

ナマズと地震予知地震の有無 𝑌 地震あり地震なし 20 ナマズの行動暴れた 𝑋 暴れていない 2 合計 22 200 20 220 合計 220 22 242 ナマズが暴れているという条件時に地震が発生する確率は20/220=1/11 233

234.

ナマズと地震予知地震の有無 𝑌 地震あり地震なし 20 ナマズの行動暴れた 𝑋 暴れていない 2 合計 22 200 20 220 合計 220 22 242 ナマズが暴れていないという条件時に地震が発生する確率は2/22=1/11 234

235.

ナマズと地震予知地震の有無 𝑌 地震あり地震なし 20 ナマズの行動暴れた 𝑋 暴れていない 2 合計 22 200 20 220 合計 220 22 242 ナマズに関する条件を排した時地震が発生する確率は22/242=1/11 235

236.

ナマズと地震予知ナマズと地震の関係ナマズの行動を確率変数𝑋と、地震を確率変数𝑌とするナマズが暴れているという条件での地震発生確率は1/11 ナマズが暴れていないという条件での地震発生確率は1/11 単なる(条件の無い)地震発生確率は1/11 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 = 𝑃 𝑌 = 𝑦𝑗 が成立！ナマズの行動と地震発生は互いに独立 236

237.

内容 1．2つの変数が独立であるとき 2．期待度数 3．独立性の検定 237

238.

期待度数地震予知のための新技術を開発した！地震の有無 𝑌 地震あり地震なし地震予知 𝑋 地震あり予測 20 地震なし予測 10 合計 30 230 40 270 合計 250 50 300 地震予知の結果と地震発生は関係あり？ 238

239.

期待度数この問題への取り組み方地震予知の結果と地震発生が無関係(独立)だと想定 →この想定と実際のデータはどれほど離れているか？期待度数地震予知の結果と地震発生が無関係(独立)だと想定 →この時の理論上の度数 239

240.

期待度数期待度数の表地震の有無 𝑌 地震あり地震なし地震予知 𝑋 地震あり予測 ? 地震なし予測 ? 合計 30 ? ? 270 合計 250 50 300 個別の度数を？マークにした理論上の期待度数を計算していこう！ 240

241.

期待度数期待度数の表地震の有無 𝑌 地震あり地震なし地震予知 𝑋 地震あり予測 ? 地震なし予測 ? 合計 30 ? ? 270 合計 250 50 300 地震予知に関する条件を排した時地震が発生する確率は30/300=1/10 241

242.

期待度数期待度数の表地震の有無 𝑌 地震あり地震なし地震予知 𝑋 地震あり予測 ? 地震なし予測 ? 合計 30 ? ? 270 合計 250 50 300 もしも地震予知と地震発生が独立なら地震予知の結果に関わらず1/10の確率で地震が発生するはず！ 242

243.

期待度数期待度数の表地震の有無 𝑌 地震あり地震なし地震予知 𝑋 地震あり予測 25 地震なし予測 ? 合計 30 ? ? 270 合計 250 50 300 もしも地震予知と地震発生が独立なら「地震あり予測」が出たという条件で「地震あり」になる回数は25回 243

244.

期待度数期待度数の表地震の有無 𝑌 地震あり地震なし地震予知 𝑋 地震あり予測 25 地震なし予測 5 合計 30 ? ? 270 合計 250 50 300 もしも地震予知と地震発生が独立なら「地震なし予測」が出たという条件で「地震なし」になる回数は5回 244

245.

期待度数期待度数の表地震の有無 𝑌 地震あり地震なし地震予知 𝑋 地震あり予測 25 地震なし予測 5 合計 30 225 45 270 合計 250 50 300 もしも地震予知と地震発生が独立なら地震があっても無くても9/10の確率で地震が発生しないはず！ 245

246.

内容 1．2つの変数が独立であるとき 2．期待度数 3．独立性の検定 246

247.

独立性の検定帰無仮説と対立仮説を設定する帰無仮説：地震予知の結果と地震発生は独立である対立仮説：地震予知の結果と地震発生は独立でない有意水準は5%とする

248.

実際のデータの度数地震予知 𝑋 地震あり予測 20 地震なし予測 10 合計 30 期待度数地震予知 𝑋 地震の有無 𝑌 地震あり地震なし 230 40 270 地震の有無 𝑌 地震あり地震なし地震あり予測 25 地震なし予測 5 合計 30 225 45 270 独立だと想定した時の期待度数と実際のデータの度数を比較しよう合計 250 50 300 合計 250 50 300

249.

実際のデータの度数地震予知 𝑋 地震あり予測 20 地震なし予測 10 合計 30 期待度数地震予知 𝑋 地震の有無 𝑌 地震あり地震なし 230 40 270 地震の有無 𝑌 地震あり地震なし地震あり予測 25 地震なし予測 5 合計 30 225 45 270 合計 250 50 300 合計 250 50 300 「度数の差の2乗」を期待度数で割る 2 20 − 25 ÷ 25 = 1

250.

実際のデータの度数地震予知 𝑋 地震あり予測 20 地震なし予測 10 合計 30 期待度数地震予知 𝑋 地震の有無 𝑌 地震あり地震なし 230 40 270 地震の有無 𝑌 地震あり地震なし地震あり予測 25 地震なし予測 5 合計 30 225 45 270 合計 250 50 300 合計 250 50 300 「度数の差の2乗」を期待度数で割る 2 10 − 5 ÷ 5 = 5

251.

実際のデータの度数地震予知 𝑋 地震あり予測 20 地震なし予測 10 合計 30 期待度数地震予知 𝑋 地震の有無 𝑌 地震あり地震なし 230 40 270 地震の有無 𝑌 地震あり地震なし地震あり予測 25 地震なし予測 5 合計 30 225 45 270 合計 250 50 300 合計 250 50 300 「度数の差の2乗」を期待度数で割る 2 230 − 225 ÷ 225 = 1Τ9

252.

実際のデータの度数地震予知 𝑋 地震あり予測 20 地震なし予測 10 合計 30 期待度数地震予知 𝑋 地震の有無 𝑌 地震あり地震なし 230 40 270 地震の有無 𝑌 地震あり地震なし地震あり予測 25 地震なし予測 5 合計 30 225 45 270 合計 250 50 300 合計 250 50 300 「度数の差の2乗」を期待度数で割る 2 40 − 45 ÷ 45 = 5Τ9

253.

独立性の検定検定統計量先ほど計算した結果を4マスすべて合計する 1 5 6 2 1 + 5 + + = 6 + = 6 + ≈ 6.67 9 9 9 3 今回の検定統計量を𝜒 2 統計量と呼ぶ (いくつかの想定を満たすなら) 2行2列のクロス集計表における𝜒 2 統計量は、自由度が1の𝜒 2 分布にしたがう(証明略) 𝜒 2 分布のパーセント点を使って棄却域を求めていこう 253

254.

独立性の検定棄却域自由度1の𝜒 2 分布の95％点≈ 3.84 データから計算された𝜒 2 統計量が3.84を超えるなら帰無仮説を棄却する統計的仮説検定の結果データから計算された𝜒 2 統計量はおよそ6.67 これは棄却域に含まれる帰無仮説は棄却されたので独立ではない地震予知は地震発生と関係がありそうだ 254

255.

後期のまとめ推測統計の理論の総復習 255

256.

内容 1．統計的仮説検定の概要 2．母平均に関する𝒕検定 256

257.

内容 1．統計的仮説検定の概要 2．母平均に関する𝒕検定 257

258.

推測統計の問題意識湖の中のすべての魚の体長母集団すべてのデータ未知のデータを含む標本母集団の一部手に入ったデータ釣りをして得られた魚の体長標本を使って、母集団の議論をしたい特に今回は母平均を調べたい

259.

統計的推測の難しさ母平均の推定くらい、簡単？標本を使って母平均について議論したい標本は母集団の一部に過ぎないよ。どのみち母集団のことわかんないだから、母平均の値なんかテキトーに答えておけばいいわ～♪ 標本を使ってできることは意外と多いよ 259

260.

推測統計の取り組み方推測統計の問題に、どうやって取り組むのか認めること① 標本という「一部」しか使わないので「母集団を完全に明らかにする」ことは無理認めること② 標本は確率的に変動する「標本から計算された統計量」も確率的に変動するそれでも頑張ること。それでもなお、あきらめないこと標本や「標本から計算された統計量」がどのように変化するか、確率的な特徴を明らかにする 260

261.

現実世界の単純化単純ランダムサンプリング母集団分布は正規分布母集団についての仮定＋標本抽出の仮定 →この仮定を置いていることに注意 261

262.

単純化された現実世界をモデル化今回の講義の想定母集団分布は正規分布である標本は単純ランダムサンプリングで得られる →標本は同一の正規分布に従う独立な確率変数確率変数 𝑋1 , 𝑋2 , … , 𝑋𝑛 無作為抽出標本抽出のモデル 𝑋𝑖 ~𝒩 𝜇, 𝜎 2 262

263.

統計的仮説検定の活用統計的仮説検定とは（ざっくり） ⚫ データを使って判断のサポートをする手法 (あくまでサポートするだけなので注意) ⚫ 第一種の過誤を犯す確率をコントロールすることを目指して判断を行う第一種の過誤帰無仮説が正しいのに、誤って棄却してしまう第二種の過誤帰無仮説が間違っているのに、誤って採択してしまう 263

264.

統計的仮説検定の活用統計的仮説検定が目指すこと母集団のパラメータが「ピッタリ10です」とはわからない →「10と異なるかどうか」を判断しよう（妥協１）「10と異なるかどうか」が完璧にはわからない →間違うことはあるけど、「第一種の過誤を犯す」確率はできる限りコントロールしよう（妥協２）でも、第一種の過誤を犯す確率も厳密には計算できないよね →単純なモデルを使って確率を計算しよう（妥協３）仮説検定は、便利ではあるものの、結果の解釈には細心の注意が必要 264

265.

統計的仮説検定の重要な用語帰無仮説・対立仮説帰無仮説：母集団の○○は××と等しい対立仮説：母集団の○○は××と異なる(大きい/小さい) 帰無仮説との矛盾の度合いを測ることで自分の主張したいことを支持する 265

266.

統計的仮説検定の重要な用語右片側検定「○○は××より大きい」を対立仮説にする (小さいことは考慮しない) 左片側検定「○○は××より小さい」を対立仮説にする (大きいことは考慮しない) 両側検定「○○は××と異なる」を対立仮説にする (大きいことも小さいことも考慮する) 266

267.

統計的仮説検定の重要な用語検定統計量統計的仮説検定を行う際に用いられる統計量のこと棄却域帰無仮説を棄却するか否かを判断するために用いられる検定統計量の範囲検定統計量が棄却域に含まれるなら帰無仮説を棄却する有意水準と棄却域の関係第一種の過誤を犯す確率を有意水準と等しくすることを目指す 267

268.

内容 1．統計的仮説検定の概要 2．母平均に関する𝒕検定 268

269.

帰無仮説と対立仮説一標本の検定の帰無仮説・対立仮説の例帰無仮説：母平均は○○と等しい対立仮説：母平均は○○と異なる(大きい/小さい) モデル：𝑋𝑖 ~𝒩 𝜇, 𝜎 2 二標本の検定の帰無仮説・対立仮説の例帰無仮説：標本𝑋の母平均と標本𝑌の母平均は等しい対立仮説：標本𝑋の母平均と標本𝑌の母平均は異なる (大きい/小さい) モデル：𝑋𝑖 ~𝒩 𝜇𝑥 , 𝜎 2 , 𝑌𝑗 ~𝒩 𝜇𝑦 , 𝜎 2 269

270.

検定統計量一標本検定の検定統計量(𝒕値) 𝑋ത − 𝜇 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 𝑈2 ∙ 𝑚 二標本検定の検定統計量(𝒕値) 𝑋ത − 𝑌ത 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 = 1 1 2 𝑈𝑝𝑜𝑜𝑙 ∙ + 𝑚 𝑛 𝜇:帰無仮説で想定された母平均 ത 𝑋:標本Xの標本平均 ത 𝑌:標本Yの標本平均 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ 𝑈 2 :不偏分散 2 𝑈𝑝𝑜𝑜𝑙 :プールされた分散

271.

検定統計量一標本検定の自由度 𝑚−1 𝜇:帰無仮説で想定された母平均 ത 𝑋:標本Xの標本平均 ത 𝑌:標本Yの標本平均 𝑚:標本Xのサンプルサイズ 𝑛 :標本Yのサンプルサイズ 𝑈 2 :不偏分散 2 𝑈𝑝𝑜𝑜𝑙 :プールされた分散二標本検定の自由度 𝑚+𝑛−2 正規母集団からの無作為標本ならば 𝒕値は上記の自由度の𝒕分布に従う

272.

片側検定の場合の棄却域標本から計算される𝑡値を𝑡𝑠𝑎𝑚𝑝𝑙𝑒 と記す有意水準を𝛼とする 𝑡分布における100 1 − 𝛼 ％点を𝑡1−𝛼 と記す 𝑡分布における100𝛼％点を𝑡𝛼 と記す右片側検定の時の棄却域 𝑡1−𝛼 < 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 左片側検定の時の棄却域 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 < 𝑡𝛼 例えば5％有意水準なら𝛼 = 0.05である右片側検定なら𝑡0.95 すなわち95％点を参照して棄却域を求める左片側検定なら𝑡0.05 すなわち 5％点を参照して棄却域を求める 272

273.

両側検定の場合の棄却域両側検定の棄却域その① 𝑡値が正の時 𝑡1−𝛼 < 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 2 両側検定の棄却域その② 𝑡値が負の時 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 < 𝑡𝛼 2 例えば5％有意水準なら𝛼 = 0.05である 𝑡値が正なら𝑡0.975 すなわち97.5％点を参照して棄却域を求める 𝑡値が負なら𝑡0.025 すなわち 2.5％点を参照して棄却域を求める → 𝑡𝑠𝑎𝑚𝑝𝑙𝑒 が2.5％点未満、あるいは97.5%より上なら 273 帰無仮説を棄却する

274.

統計的仮説検定を利用する際の注意点注意点その① 検定の非対称性注意点その② モデルが想定している仮定について注意点その③ 無理やり有意差を出そうとしていないか？注意点その④ 有意差が出たことを過信していないか？ 274

275.

統計学 II 第15回：期末テスト

276.

統計学の講義を終えてどちらが「良い」かどちらを選ぶべきだろう？売上を増やすために、製品の宣伝をしよう！宣伝に効果はないかな？やっぱり宣伝無し？そうだ、データ使おう！宣伝をした時としなかった時で売上を比較 276

277.

宣伝するべき？売り上げ平均の比較 56 54 52 50 48 46 宣伝あり宣伝の効果ありだ！宣伝無し本当かな？ 277

278.

宣伝するべき？売り上げの差は小さい売り上げ平均の比較 60 55 50 40 20 0 宣伝あり宣伝無しグラフの原点を0にしたよ 278

279.

宣伝するべき？微差であっても、宣伝ありの方が売上が高い売上はばらつくから、偶然そうなっただけかも判断を間違う確率をコントロールしたいなそうだ、統計的仮説検定を使おう！宣伝をした時としなかった時で売上を比較 279

280.

宣伝するべき？帰無仮説：宣伝あり・無しで売り上げの平均値は同じ対立仮説：宣伝あり・無しで売り上げの平均値が異なる有意水準5％で2標本の𝑡検定を実施第一種の過誤(帰無仮説を誤って棄却)を犯す確率を5％にコントロールする 280

281.

宣伝するべき？検定統計量が棄却域に含まれる→帰無仮説を棄却宣伝の有無で、売上の平均値は有意に異なる検定統計量が棄却域に含まれない→帰無仮説を棄却できない売上の平均値が有意に異なるとは言えない →判断を保留する判断保留は、決して悪いことではない判断保留という結論もとても大切 281

282.

宣伝するべき？有意差があったのでヨシ！統計的仮説検定の想定は満たされているかな？（正規母集団からの無作為標本、等）分析が利用できるシチュエーションかチェックすることが必須 282

283.

統計学の講義を終えて Step1：データを使おう！データを見てみよう！データを使ってみようと思えたら、大きな進歩！ Step2：データを疑おう色々な角度からデータを吟味しよう区間推定や仮説検定など、データのばらつきを考慮した分析方法の利用も検討しよう Step3：分析方法を疑おう区間推定や仮説検定を実施する際に想定したことがちゃんと満たされているのかチェックしようやることがたくさんあって、少し大変？ 283

284.

面倒なことはパソコンにやってもらおう！プログラミング演習について「統計学II」の講義の補講としてプログラミング演習を実施(成績には一切影響なし) 日時：場所：内容：初等的な統計分析をPythonで実行 (記述統計・区間推定・仮説検定) 持ち物：自分のノートパソコン(要ネット接続) ※終了しました。来年度も実施したいプログラミングで、データ分析は簡単に！参加希望者は馬場にメールしてください 284

Logics of Blue

関連スライド

統計学I-1

統計学I-2

統計学II-1

統計学II-2

学振特別研究員になるために～2026年度申請版

EGG '24 | ゲーム業界ホワイト化の光と影

各ページのテキスト