ベイズ統計_06_マルコフ連鎖モンテカルロ法(1)

1.

ベイズ統計 06 マルコフ連鎖モンテカルロ法(1) 分寺杏介神戸大学大学院経営学研究科  bunji@bear.kobe-u.ac.jp ※本スライドは，クリエイティブ・コモンズ表示-非営利 4.0 国際ライセンス（CC BY-NC 4.0）に従って利用が可能です。

https://creativecommons.org/licenses/by-nc/4.0/

2.

ベイズ統計には慣れましたか？【ここまでのおさらい】 ▌ベイズ統計における分布の更新をいくつかの例で見てきました二項分布，ポアソン分布，正規分布共役事前分布がある場合は手計算でもやっていける ▌合わせてstanで同じ事後分布が得られることを確認しましたなんなら共役事前分布を置かなくてもうまいこと事後分布を作り出してくれる【今回からは】 ▌ stanの中で何が行われているかを解説していきます数理的なことは知らなくてもstanは使えるが，知っておいたほうが良いことが結構ある 06 マルコフ連鎖モンテカルロ法(1) 2

3.

MCMC ▌stanはMCMC法を行うプログラミング言語です今回は Markov Chain マルコフ連鎖と Monte Carlo 法のお話をしていきますモンテカルロこれらを組み合わせたMCMC法の話は次回です 06 マルコフ連鎖モンテカルロ法(1) 3

4.

１モンテカルロ法 Monte Carlo 06 マルコフ連鎖モンテカルロ法(1) 4

5.

モンテカルロ法 ▌乱数を用いて行う数値計算など全般のことスタニスワフ・ウラムモンテカルロ法を考案した人 stanの名前の由来モンテカルロはギャンブルが盛んな地域ギャンブルのように確率的に挙動するものについて「とりあえず何回も繰り返す」ことで近似的な解を得ることができる大数の法則などを考えるとそんな気がしてきます 06 マルコフ連鎖モンテカルロ法(1) 5

6.

まずは試してみる【よくある例】円周率を計算してみましょう 𝑦 円の面積の公式は 1 半径×半径×𝜋 右の四角形の面積は４ -1 0 𝑥 1 -1 06 マルコフ連鎖モンテカルロ法(1) 6

7.

まずは試してみる【よくある例】円周率を計算してみましょう 𝑦 円の面積の公式は 1 半径×半径×𝜋 右の四角形の面積は４ここで，右の四角形の中にランダムな点を打つ ▶点の (𝑥, 𝑦)座標について -1 𝑥 2 + 𝑦 2 ≤ 1 の場合 𝑥 2 + 𝑦 2 > 1 の場合点は円の中にある点は円の外にある ▼ ▼ 青く塗っておきます赤く塗っておきます 06 マルコフ連鎖モンテカルロ法(1) 0 𝑥 1 -1 7

8.

まずは試してみる【よくある例】円周率を計算してみましょう 𝑦 円の面積の公式は 1 半径×半径×𝜋 右の四角形の面積は４ここで，右の四角形の中にランダムな点を打つ ▶点の (𝑥, 𝑦)座標について -1 𝑥 2 + 𝑦 2 ≤ 1 の場合 𝑥 2 + 𝑦 2 > 1 の場合点は円の中にある点は円の外にある ▼ ▼ 青く塗っておきます赤く塗っておきます 06 マルコフ連鎖モンテカルロ法(1) 0 𝑥 1 -1 8

9.

まずは試してみる【よくある例】円周率を計算してみましょう 𝑦 円の面積の公式は 1 半径×半径×𝜋 右の四角形の面積は４ここで，右の四角形の中にランダムな点を打つひたすら点を打ち続ける ▶ 円の中に入るものもあれば入らないものもある -1 0 𝑥 1 -1 06 マルコフ連鎖モンテカルロ法(1) 9

10.

まずは試してみる【よくある例】円周率を計算してみましょう 𝑦 円の面積の公式は 1 半径×半径×𝜋 右の四角形の面積は４ここで，右の四角形の中にランダムな点を打つ -1 ひたすら点を打ち続ける【ここで】 0 1 1 半径×半径×𝜋 = 𝜋 円の面積点が円の中に落ちる確率 = 四角形の面積 4 06 マルコフ連鎖モンテカルロ法(1) -1 10 𝑥

11.

まずは試してみる【よくある例】円周率を計算してみましょう 𝑦 円の面積の公式は 1 半径×半径×𝜋 右の四角形の面積は４ここで，右の四角形の中にランダムな点を打つ -1 ひたすら点を打ち続ける 0 1 1 【すなわち】 𝜋 = 4 × 点が円の中に落ちる確率点をたくさん打って円の中に落ちた点の割合を求めたら円周率がだいたい分かる！ 06 マルコフ連鎖モンテカルロ法(1) -1 11 𝑥

12.

Rで試してみる sample の頭文字を取ってsとしておきます s <- 100 #点の数 X座標とY座標をそれぞれ𝑈(−1,1)から発生させる x <- runif(s, -1, 1) y <- runif(s, -1, 1) 06 マルコフ連鎖モンテカルロ法(1) 12

13.

Rで試してみる各点が円の内側にあるかを判定する r <- 100 #点の数 x <- runif(r, -1, 1) y <- runif(r, -1, 1) check <- (x^2 + y^2 <= 1) 06 マルコフ連鎖モンテカルロ法(1) 13

14.

Rで試してみる四角形の面積から、円の面積を求める s <- 100 #点の数 x <- runif(s, -1, 1) y <- runif(s, -1, 1) check <- (x^2 + y^2 <= 1) 4*mean(check) [1] 3.16 もちろん100個程度の点ではたまたまうまくいくこともあれば真の値と大きく離れることも多々ありますもっと点の数を増やしてみましょう 06 マルコフ連鎖モンテカルロ法(1) 14

15.

もっと増やす点の数を100000個に変えてみる s <- 100000 #点の数 x <- runif(s, -1, 1) y <- runif(s, -1, 1) check <- (x^2 + y^2 <= 1) 4*mean(check) [1] 3.1378 モンテカルロ法による近似の精度はサンプルの数によって決まる乱数の数は多いほうが良い …計算リソースの許す限り 06 マルコフ連鎖モンテカルロ法(1) 15

16.

モンテカルロ法の例２ ▌モンテカルロ積分 𝑏 何かしらの関数𝑓 𝑥 を区間[𝑎, 𝑏]で積分することを考えるここで，𝑥 が一様分布𝑈[𝑎, 𝑏]に従う乱数だと考えてみる න 𝑓 𝑥 𝑑𝑥 𝑎 𝑃 𝑥 = 1 𝑏−𝑎 すると… 𝑏 𝑏 𝑎 𝑎 𝑓 𝑥 න 𝑓 𝑥 𝑑𝑥 = න 𝑃(𝑥)𝑑𝑥 𝑃 𝑥 𝑃 𝑥 1 = 𝑏−𝑎 は𝑥を含まない関数なので積分の外に出すことができる 𝑏 = 𝑏 − 𝑎 න 𝑓 𝑥 𝑃 𝑥 𝑑𝑥 𝑎 = 𝑏−𝑎 𝐸 𝑓 𝑥 | 𝑥 𝑎 ≤𝑥 ≤𝑏 連続変数の関数の期待値は 𝐸𝑓 𝑥 【例】𝐸 𝑥 06 マルコフ連鎖モンテカルロ法(1) = න 𝑓 𝑥 𝑃 𝑥 𝑑𝑥 = ‫𝑥𝑑 𝑥 𝑃𝑥 ׬‬ 16

17.

モンテカルロ積分 𝑏 න 𝑓 𝑥 𝑑𝑥 = 𝑏 − 𝑎 𝐸 𝑓 𝑥 | 𝑥 𝑎 ≤ 𝑥 ≤ 𝑏 𝑎 つまり区間 [𝑎, 𝑏]における期待値 𝐸[𝑓(𝑥)]さえわかれば良いこれをモンテカルロ法で求める 𝑠 1 ≃ ෍ 𝑥𝑖 𝑠 𝐸𝑓 𝑥 𝑛 は乱数の数 𝑖=1 【例】正規分布𝑁(0,1)において、-1から1の間の確率は？この面積 06 マルコフ連鎖モンテカルロ法(1) 17

18.

モンテカルロ積分 ① 一様分布𝑈[−1,1]から乱数𝑥を生成する x <- runif(10000, -1, 1) ② 各𝑥における確率密度𝑓(𝑥)を計算する fx <- dnorm(x,0,1) ③ それを平均すると𝐸[𝑓(𝑥)]になる 𝑏 න 𝑓 𝑥 𝑑𝑥 = 𝑏 − 𝑎 𝐸[𝑓(𝑥)] Efx <- mean(fx) 𝑎 理論的には ④ あとは 𝑏 − 𝑎 倍するだけ 2*Efx pnorm(1,0,1) – pnorm(-1,0,1) [1] 0.6811606 [1] 0.6826895 06 マルコフ連鎖モンテカルロ法(1) 18

19.

これまでもモンテカルロ法やってました資料04, 05 解析的にわかった事後分布から大量の乱数をって事後分布をプロ事後分布のプロ事後分布からの乱数生成 , | , き分布になっている場合はからの乱数をいまったカル密度にるンマ分布に従う乱数精度の数 | ) からのサンプリングを一つずつ用いて，から乱数を , る , 周ですスグラいくつ乱数を作るか事後分布 ( どちらをってもしてみたり 10 に従う乱数事後分布 ( | ) からのサンプリングと同じこと的な的な論 06 マルコフ連鎖モンテカルロ法(1) 論 19

20.

これまでもモンテカルロ法やってました解析的にわかった事後分布から大量の乱数をって事後分布の記述統計量を計算してみたり事後分布からの点事後分布からの乱数生成 , | の乱数をにはいまったる点ンマ分布に従う乱数精度の数 | ) からのサンプリングを一つずつ用いて，から乱数を , る値およ確区間を出してくれる関数がある値もちんにしても同様に計算可能です（事後期待値）（事後中値）（事後値）乱数をもとに計算しているので結はになるといます確区間 , 周資料 4 もにいくつ乱数を作るか事後分布 ( ・区間 , き分布になっている場合はから資料04, 05 10 に従う乱数事後分布 ( | ) からのサンプリングと同じこととも的なばれるので的な論 06 マルコフ連鎖モンテカルロ法(1) 論 20

21.

そんなモンテカルロ法の【メリ】時間さえかければたいていの問題には答えが出せるパラメータの次元が増えてもなんとかなる【デメリ】計算に時間がかかるコンピュータに負荷がかかる乱数生成しやすい分布じゃないと使えない ▶ ベイズ統計の場合，共役事前分布がないと厳しい共役事前分布がないときにもモンテカルロ法えないかなぁこんなのだと乱数も作りづらい 06 マルコフ連鎖モンテカルロ法(1) 21

22.

２マルコフ連鎖 Markov Chain 06 マルコフ連鎖モンテカルロ法(1) 22

23.

マルコフ連鎖 ▌マルコフ性を持つ確率過程のうち、時間が離散的なものある時点での状態は、その一つ前の状態のみによって決まる【例】毎日の晩ごはんをクジで決める際に，昨日の晩ごはんとはかぶらないようにするがおととい以前のメニュは気にしない場合，これはマルコフ連鎖である。 𝑃 𝑋 (𝑡) = 𝑥 𝑋 (𝑡−1) = 𝑥 (𝑡−1) = 𝑃 𝑋 (𝑡) = 𝑥 𝑋 (𝑡−1) = 𝑥 (𝑡−1) , ⋯ , 𝑋 (2) = 𝑥 (2) , 𝑋 (1) = 𝑥 (1) 𝑋 (1) から𝑋 (𝑡−2) までの情報はあってもなくても𝑃(𝑋 (𝑡) = 𝑥) に影響がない，ということ一方で，もし「これまでの人生で食べて来た晩ごはんのメニューの割合」的なものによってクジの確率が決定している場合には，マルコフ過程ではない。 𝑃 𝑋 (𝑡) = 𝑥 𝑋 (𝑡−1) = 𝑥 (𝑡−1) ≠ 𝑃 𝑋 (𝑡) = 𝑥 𝑋 (𝑡−1) = 𝑥 (𝑡−1) , ⋯ , 𝑋 (2) = 𝑥 (2) , 𝑋 (1) = 𝑥 (1) 06 マルコフ連鎖モンテカルロ法(1) 23

24.

マルコフ連鎖の例 ▌この世に残された晩ごはんのレリは以下の４つのみです。焼き魚チャハンサラダステキ日本人の心ラクだし安いヘルシ自分へのご褒美 06 マルコフ連鎖モンテカルロ法(1) 24

25.

晩ごはんのマルコフ連鎖 ▌毎日の晩ごはんを「前日何食べたか」から確率的に決めます 0.4 0.2 0.3 0.3 0.2 0.1 0.1 0.5 0 0.2 0.2 0.2 0.3 0.6 0.1 0.3 06 マルコフ連鎖モンテカルロ法(1) 25

26.

晩ごはんのマルコフ連鎖 ▌毎日の晩ごはんを「前日何食べたか」から確率的に決めます 0.4 【例】昨日はステーキを食べました。なので今日は 0.2 ヘルシ寄りで行こうかと思います。 0.3 0.3 0.2 0.1 クで今日の晩ごはんを決めます。 0.1 0.5 0 0.2 0.2 0.2 0.3 • 0.3の確率で焼き魚 • 0.1の確率でチャーハン • 0.6の確率でサラダ • 2日連続ステーキにはならない確率0 0.6 0.1 0.3 06 マルコフ連鎖モンテカルロ法(1) 26

27.

晩ごはんのマルコフ連鎖移確率を表にまとめていくときょうきのう 0.3 0.1 06 マルコフ連鎖モンテカルロ法(1) 0.6 0 27

28.

晩ごはんのマルコフ連鎖同様に，すべての移確率をまとめる移確率行列きょうきのう 0.4 0.3 0.2 0.1 0.2 0.5 0.1 0.2 0.2 0.2 0.3 0.3 0.3 0.1 0.6 0 06 マルコフ連鎖モンテカルロ法(1) 28

29.

マルコフ連鎖に基づく計算高校数学でこういった問題を解いたことがあるかもしれません初期の状態確率がわかっていれば、任意の時点での確率が計算可能例今日の晩御飯は，確率がそれぞれ等しく0.25のクによって決めることにします。このとき，明日の晩ごはんの確率はどうなっているでしょうか。 • 今日の晩ごはんが焼き魚であるとすると、明日の晩ごはんの確率は(0.4, 0.3, 0.2, 0.1) • 今日の晩ごはんがチャハンであるとすると、明日の晩ごはんの確率は(0.2, 0.5, 0.1, 0.2) • 今日の晩ごはんがサラダであるとすると、明日の晩ごはんの確率は(0.2, 0.2, 0.3, 0.3) • 今日の晩ごはんがステキであるとすると、明日の晩ごはんの確率は(0.3, 0.1, 0.6, 0) 周辺化することで簡単に計算できる例 𝑃 明日は焼き魚 = ෍ 𝑃 明日は焼き魚今日は𝑥 𝑃(今日は𝑥) 𝑥 06 マルコフ連鎖モンテカルロ法(1) 29

30.

同様に，すべての行列をつかってきょう …という計算をひっくるめて書くと 𝑃 明日の晩ごはん 𝑃 𝜃1 移確率をまとめると以後しばらくは 𝜃 𝑡 を「今日から𝑡日後の晩ごはん」を表す記号とします 𝑃 今日の晩ごはん × =𝑃 𝜃 0 きのう移確率行列 × 𝑃 𝜃 𝑡+1 𝜃 𝑡 0 0 = 0 5 0 5 0 5 0 5 × 0 03 ෍ 𝑃 明日は焼き魚今日は𝑖 𝑃(今日は𝑖) 03 05 0 01 0 01 01 0 03 03 0 0 𝑃 𝜃 𝑡+1 𝜃 𝑡 法 =𝑃 𝜃1 𝜃0 =𝑃 𝜃2 𝜃1 =𝑃 𝜃3 𝜃2 ⋮ 𝑖 = 0 0 0 0 5×0 + 0 5×03 + 0 5×0 + 0 5×01 + 0 5×0 + 0 5×05 + 0 5×01 + 0 5×0 + 0 5×0 + 0 5×0 + 0 5×03 + 0 5×03 + 0 06 マルコフ連鎖モンテカルロ法(1) 5×03 5×01 5×0 5×00 0 75 0 75 = 03 0 15 30

31.

Rでやってみる trans <- c(0.4, 0.3, 0.2, 0.1, まずは 0.2, 0.5, 0.1, 0.2, 0.2, 0.2, 0.3, 0.3, 0.3, 0.1, 0.6, 0 移確率行列の要素だけ書き並べる見やすくするために改行しただけなので, 改行はしてもしなくても大丈夫です ) trans_mat <- matrix(trans, nrow=4, ncol=4, byrow=T) [,1] [,2] [,3] [,4] [1,] 0.4 0.3 0.2 0.1 [2,] 0.2 0.5 0.1 0.2 [3,] 0.2 0.2 0.3 0.3 [4,] 0.3 0.1 0.6 0.0 移確率行列 ←こうなればOK pi0 <- t(c(0.25, 0.25, 0.25, 0.25)) [,1] [,2] [,3] [,4] [1,] 0.25 0.25 0.25 0.25 初期状態 ←こうなればOK 06 マルコフ連鎖モンテカルロ法(1) 31

32.

Rでやってみる pi0 %*% trans_mat Rで行列の演算を行う際には，演算子を%で挟むと大体うまく行く [,1] [,2] [,3] [,4] [1,] 0.275 0.275 0.3 0.15 𝑃 𝜃1 =𝑃 𝜃 0 × 𝑃 𝜃 𝑡+1 𝜃 𝑡 例今日の晩御飯は，確率がそれぞれ等しく0.25のクによって決めることにします。このとき，2日後の晩ごはんの確率はどうなっているでしょうか。１日後の確率𝑃 𝜃 1 にもう一度移確率行列をかけてあげればよい pi0 %*% trans_mat %*% trans_mat [,1] [,2] [,3] [,4] [1,] 0.27 0.295 0.2625 0.1725 𝑃 𝜃2 =𝑃 𝜃 1 =𝑃 𝜃 0 × 𝑃 𝜃 𝑡+1 𝜃 𝑡 × 𝑃 𝜃 𝑡+1 𝜃 𝑡 × 𝑃 𝜃 𝑡+1 𝜃 𝑡 この調子でどこまでもいけそうだ！ 06 マルコフ連鎖モンテカルロ法(1) 32

33.

遠い未来の確率だって計算できる例では，50日後の晩ごはんの確率はどうなっているでしょうか。 pi_n <- pi0 # n日後の確率を入れておく箱 𝑃 𝜃 50 for (i in 1:50) pi_n <- pi_n %*% trans_mat 𝑃 𝜃0 = × 𝑃 𝜃 𝑡+1 𝜃 𝑡 × ⋯ × 𝑃 𝜃 𝑡+1 𝜃 𝑡 50回 > pi_n [,1] [,2] [,3] [,4] [1,] 0.2707483 0.3006803 0.262585 0.1659864 例では，100日後の晩ごはんの確率はどうなっているでしょうか。完全に一致 pi_n <- pi0 for (i in 1:100) pi_n <- pi_n %*% trans_mat > pi_n [,1] [,2] [,3] [,4] [1,] 0.2707483 0.3006803 0.262585 0.1659864 06 マルコフ連鎖モンテカルロ法(1) 33

34.

初期確率を変えてみると…？例では，50日後の晩ごはんの確率はどうなっているでしょうか。 pi_n <- pi0 # n日後の確率を入れておく箱 𝑃 𝜃 50 for (i in 1:50) pi_n <- pi_n %*% trans_mat 𝑃 𝜃0 = × 𝑃 𝜃 𝑡+1 𝜃 𝑡 × ⋯ × 𝑃 𝜃 𝑡+1 𝜃 𝑡 50回 > pi_n [,1] [,2] [,3] [,4] [1,] 0.2707483 0.3006803 0.262585 0.1659864 例では，今日はステーキだった場合の50日後の晩ごはんの確率は？ pi_n <- t(c(0,0,0,1)) # ステーキで確定しているのでそれでも完全に一致 for (i in 1:50) pi_n <- pi_n %*% trans_mat > pi_n [,1] [,2] [,3] [,4] [1,] 0.2707483 0.3006803 0.262585 0.1659864 06 マルコフ連鎖モンテカルロ法(1) 34

35.

マルコフ連鎖のポイン 𝑃 𝜃 50 このように、マルコフ連鎖は初の状態確率が何であれ十分大きい回数連鎖を伸ばすと = 𝑃 𝜃 51 = 𝑃 𝜃 52 =⋯=𝑃 𝜃∞ 終的に同じ確率分布に収束する ▶ この確率分布を定常分布と呼びます Stationary distribution ※具体的には、以下の条件を満たす場合に定常分布に収束するのですが，とりあえずMCMCの話においては以下は満たされていると思っていただいて構いません。既約性｜どの状態からどの状態にも、頑張れば確率的には到達可能非周期性｜nの倍数のときだけ必ずある状態に帰ってくる、みたいなことは無しで再帰性｜最初の状態に、理論的には有限時間で必ず帰ってくる 06 マルコフ連鎖モンテカルロ法(1) 35

36.

マルコフ連鎖のいいとこ ▌どんな初期値から始めても終的には常分布に収束する収束した後は, 常分布からのランダサンプリングと同じ 1日ずつ「前の日」の結に基づいて抽選 51日目 [,1] [,2] [,3] [,4] [1,] 0.4 0.3 0.2 0.1 100日目 [,1] [,2] [,3] [,4] [1,] 0.2 0.2 0.3 0.3 > pi_n [,1] [,2] [,3] [,4] [1,] 0.2707483 0.3006803 0.262585 0.1659864 … 50日目 [,1] [,2] [,3] [,4] [1,] 0.2 0.5 0.1 0.2 常分布から一気にn日分抽選 … 06 マルコフ連鎖モンテカルロ法(1) 36

37.

晩ごはんの話 ▌実際に２つの方法で晩ごはんを1,000,000回決めてみます ① 1日ずつ「前の日」の結に基づいて抽選 51日目 [,1] [,2] [,3] [,4] [1,] 0.4 0.3 0.2 0.1 100日目 [,1] [,2] [,3] [,4] [1,] 0.2 0.2 0.3 0.3 常分布から一気にn日分抽選 > pi_n [,1] [,2] [,3] [,4] [1,] 0.2707483 0.3006803 0.262585 0.1659864 … 50日目 [,1] [,2] [,3] [,4] [1,] 0.2 0.5 0.1 0.2 ② … 06 マルコフ連鎖モンテカルロ法(1) 37

38.

晩ごはんの運命は… 焼き魚 ※初日はだとしておきます。晩ごはんのマルコフ連鎖 ① 前日の晩ごはんから確率的に決める移確率同様に，すべてのをまとめると > table(dinner_list_1) dinner_list_1 1 2 3 4 271542 300777 262139 165542 きょうきのう ② だいたい同じ割合になった常分布から毎日ランダに決める > pi_n [,1] [,2] [,3] [,4] [1,] 0.2707483 0.3006803 0.262585 0.1659864 > table(dinner_list_2) dinner_list_2 1 2 3 4 270538 300959 262152 166351 法マルコフ連鎖による「一つ前の値に基づく」サンプリング定常分布＝事後分布からのサンプリング 06 マルコフ連鎖モンテカルロ法(1) 38

39.

（補足）晩ごはん抽選のRコド n <- 1000000 # 抽選回数 # 1)毎日前日の晩御飯にづいて抽選 dinner_list_1 <- numeric(n) # 長さnのクトル結果をいれる箱 dinner_list_1[1] <- 4 # 初日はステーキ for(i in 2:n){ 遷移確率行列のうち前日の晩ごはん dinner_list_1[i-1] 行目を確率probとして与える dinner_list_1[i] <- sample(x=4, size=1, prob = trans_mat[dinner_list_1[i-1],]) } # 2)定常分布からランダムサンプリング dinner_list_2 <- sample(x=4, size=n, replace = TRUE, prob = pi_n) # 結果 table(dinner_list_1) table(dinner_list_2) 06 マルコフ連鎖モンテカルロ法(1) 39

40.

これをベイズ統計に適用できれば ▌もしも常分布が事後分布だったら… 𝜃 (1) 𝜃 (2) 𝜃 (3) 𝜃 (4) 初の方のサンプリングの確率は初期値の影響を受ける（＝初期値によって確率が変わる）常分布からのランダサンプリングとは言えない … 𝜃 (𝑆) ひたすら繰り返すと，あるとこからは常分布に移行する。「一つ前の値」から確率的に決「しても常分布」からのランダサンプリングとみなすことができるこの部分だけえば「事後分布からの乱数」によるモンテカルロ法がえる！ 06 マルコフ連鎖モンテカルロ法(1) 40

41.

ベイズ統計の夢とMCMC ▌ベイズ統計がマルコフ連鎖とモンテカルロ法をつかってやりたいこと事後分布の性質を知ることでも事後分布はこんなグネグネのやつかも ▌共役事前分布はいいよなぁもし事後分布の形がよく知られた分布ただの正規分布などであれば，モンテカルロ法によって点定や区間定を近似的に行うことが可能だった ▌でも共役事前分布はあまり無いよなぁ現実的に出くわす問題のほとんどでは，事前分布を解析的に求めるのはほぼ不可能 ▶ ただのモンテカルロ法では無理！ ※乱数を生成することができないため 06 マルコフ連鎖モンテカルロ法(1) 41

42.

ベイズ統計の夢とMCMC ▌ベイズ統計がマルコフ連鎖とモンテカルロ法をつかってやりたいこと事後分布の性質を知ることでも事後分布はこんなグネグネのやつかも ▌そこでマルコフ連鎖の出マルコフ連鎖ではもし常分布＝事後分布であれば適当な移確率のもとで実質的に事後分布からの計算を繰り返せばランダサンプリングが可能にそのうち常分布に収束することが約束されているでは推移確率をどのように設定すると，定常分布が事後分布に一致するのか？ ▼ モンテカルロ法がえる！ 06 マルコフ連鎖モンテカルロ法(1) 42

43.

初期状態と常分布 ▌どんな初期値から始めても終的には常分布に収束するしかし当然ながら，晩ごはんのマルコフ連鎖同様に，すべての先ほどの移確率をまとめると移確率が変わると常分布も変化する晩ごはんのマルコフ連鎖移確率同様に，すべてのきょうヘルシ志向な移確率をまとめると移確率きょうきのうきのう法法サラダ選ばれがち > pi_n > pi_n [,1] [,2] [,3] [,4] [1,] 0.2707483 0.3006803 0.262585 0.1659864 [,1] [,2] [,3] [,4] [1,] 0.3917051 0.09447005 0.4585253 0.05529954 06 マルコフ連鎖モンテカルロ法(1) 43

44.

マルコフ連鎖をえば ▌どんな初期値から始めても終的には常分布に収束する統計的にはこれが事後分布になってほしい晩ごはんの例常分布わからないベイズ統計モデル尤度×事前分布ならわかる事後分布そのものは，周辺尤度＝積分があるので無理移確率じゃあどうするかわかる定常分布＝事後分布となるような移確率はわからない移確率行列を使って計算したら定常分布がでてくる移確率をうまいことって，常分布が事後分布と同じ形になるようにする移確率をどう設すると常分布が事後分布になるかは次回！ 06 マルコフ連鎖モンテカルロ法(1) 44

45.

晩ごはんの例で言えば > pi_n [,1] [,2] [,3] [,4] [1,] 0.2707483 0.3006803 0.262585 0.1659864 問毎日の晩ごはんのメニュの確率（事後分布）は▲のようになることはわかっています。ただし手元には10面ダイスしかないので，そんなに細かい確率でランダに決めるのは大変です。普通のモンテカルロ法は難しい状況しかしこの場合，マルコフ連鎖の考え方をえば，定常分布が事後分布に一致する「ある特定の推移確率」に基づいて「毎日前日のメニュから確率的に決める」ことで，事後分布からのランダサンプリングと結的に同じことができます。では，定常分布が事後分布に一致する「ある特定の推移確率」とは，どんなものでしょうか。きょうきのう常分布＝終的な毎日の晩ごはんのメニュの確率になるような移確率の設定の仕方がマルコフ連鎖モンテカルロ法のキモとなります。 06 マルコフ連鎖モンテカルロ法(1) 45

46.

離散分布のマルコフ連鎖 p. 30 晩ごはんのマルコフ連鎖 𝑃 𝜃 𝑡+1 𝜃 𝑡 𝑃 明日は焼き魚 = 行𝑖 𝑃 今日は焼き魚 𝑃 明日は焼き魚今日は焼き魚 + 𝑃 今日はチャハン 𝑃 明日は焼き魚今日はチャハン + 𝑃 今日はサラダ 𝑃 明日は焼き魚今日はサラダ + 𝑃 今日はステキ 𝑃 明日は焼き魚今日はステキ列𝑗 同様に，すべての移確率をまとめると 1 2 3 4 きょうきのう 1 2 3 𝑃 明日は焼き魚 = 4 ෍ 𝑃(今日は𝑖)𝑃 明日は焼き魚今日は𝑖 𝑖 一般化すると法 𝑃 𝜃 (𝑡+1) = 𝑗 = ෍ 𝑃 𝜃 (𝑡) = 𝑖 𝑃 𝜃 (𝑡+1) = 𝑗 𝜃 (𝑡) = 𝑖 𝑖 全部まとめた書き方 𝑃 𝜃 (𝑡+1) = 𝑃 𝜃 (𝑡) 𝑃 𝜃 (𝑡+1) 𝜃 (𝑡) 06 マルコフ連鎖モンテカルロ法(1) 46

47.

連続分布でも同じこと ▌連続分布へ拡張する場合，和→積分に置き換えるだけで良い特 (𝑡+1) = 𝑃 𝜃 (𝑡) 𝑃 𝜃 (𝑡+1) 𝜃 (𝑡) 𝑃 𝜃 離散分布では（常分布）事後分布連続分布では 𝑃 𝜃 𝑡+1 （移確率）移核 = න 𝑃 𝜃 (𝑡) 𝑃 𝜃 (𝑡+1) 𝜃 (𝑡) 𝑑𝜃 (𝑡) の事象に限した場合 𝑃 𝜃 (𝑡+1) = 𝑗 = ෍ 𝑃 𝜃 (𝑡) = 𝑖 𝑃 𝜃 (𝑡+1) = 𝑗 𝜃 (𝑡) = 𝑖 𝑖 𝑃 𝜃 (𝑡+1) = 𝑗 = න 𝑃 𝜃 (𝑡) = 𝑖 𝑃 𝜃 (𝑡+1) = 𝑗 𝜃 (𝑡) = 𝑖 𝑑𝑖 ここがどのような設であれば 𝑃 𝜃 (𝑡) = 𝑃 𝜃 𝑡+1 となるのか？ 06 マルコフ連鎖モンテカルロ法(1) 47

48.

マルコフ連鎖に基づく乱数生成（常分布）事後分布連続分布では 𝑃 𝜃 𝑡+1 （移確率）移核 = න 𝑃 𝜃 (𝑡) 𝑃 𝜃 (𝑡+1) 𝜃 (𝑡) 𝑑𝜃 (𝑡) = 𝑃 𝜃 𝑌 ∝ 𝐿 𝑌 𝜃 𝑃(𝜃) 𝑃 𝜃 (𝑡) = 𝑃 𝜃 𝑡+1 (に比例する値)の計算は可能なので，上の式を 𝑃 𝜃 (𝑡+1) 𝜃 (𝑡) = 𝑃 𝜃 𝑡 , 𝑃 𝜃 𝑡+1 の関数の形に整理できれば良さそう ▌結局やっていることは乱数 𝜃 (𝑡) の生成分布から適当な乱数 𝜃 (𝑡) を生成する【ポント】確率分布事後分布全体の形は分からなくても事後分布における特定の点の確率密度は計算可能 𝜃 (𝑡) 所与のもとで，移核に従って次の乱数𝜃 (𝑡+1) の発生確率分布が決まる 06 マルコフ連鎖モンテカルロ法(1) 乱数 𝜃 (𝑡+1) の生成分布から適当な乱数 𝜃 (𝑡+1) を生成する 48

49.

まとめと次回予告【まとめ】 ▌モンテカルロ法とマルコフ連鎖のことが分かりましたモンテカルロ法を使えば乱数を使って事後分布を復元できそう事後分布が解析的に分からなくても，定常分布さえ作れたらモンテカルロ法は使えるただ定常分布＝事後分布となる移確率移核は簡単には分からない【次回予告】 ▌いよいよマルコフ連鎖モンテカルロ法（MCMC）を紹介します定常分布が事後分布と一致するように，移確率を設定する方法の話 06 マルコフ連鎖モンテカルロ法(1) 49

ベイズ統計_06_マルコフ連鎖モンテカルロ法(1)

Kyosuke Bunji

関連スライド

ベイズ統計_07_マルコフ連鎖モンテカルロ法(2)

ベイズ統計_02_確率の基本とベイズの定理

ベイズ統計_01_イントロダクション

ベイズ統計_03_尤度

ベイズ統計_05_基本的なベイズ推論(2)

ベイズ統計_04_事前分布・基本的なベイズ推論(1)

各ページのテキスト