41.6K Views
November 26, 22
スライド概要
ヘルスデータサイエンス学会第1回学術集会 シンポジウム2「統計的因果推論の基礎と最前線」|2022年11月26日
Assoc prof at Tokyo University of Science. PhD in health sciences/MPH at the University of Tokyo. Causal inference in epidemiology/biostatistics.
2022年11月26日(水)14:15–16:00 ヘルスデータサイエンス学会 第1回学術集会 シンポジウム2 「統計的因果推論の基礎と最前線」 因果媒介分析 Causal Mediation Analysis 東京理科大学 工学部 情報工学科 篠崎 智大 [email protected] 演題発表に関連し、発表者には 開示すべき COI 関係にある企業などはありません
アウトライン • 「因果」 媒介分析とは • なぜ媒介分析? • なぜ 「因果」 媒介分析? • 因果媒介分析のやり方、結果の見方 • 因果媒介分析の実例 2
「因果」 媒介分析 “causal” mediation analysis • 媒介分析 • 曝露 - 中間変数 - アウトカム の関係を調べる • とくに、直接効果と間接効果への分解 • 従来法 • 回帰係数の組み合わせで 「効果」 を定義 • 「因果」 • 反事実アウトカムにもとづいて各効果を定義 • 例 : 「曝露を受けた場合」 vs. 「受けなかった場合」 • 観察データから求めるための条件と手法を整理 • 推定段階で回帰モデルが使われることもある • 効果の定義と推定手法を切り離した点で従来法とちがう 3
直接効果と間接効果 • 総合効果 • 治療後の全ての変化を通した効果 • 間接効果 • ある機序を介して発現する効果 • 直接効果 • それ以外のあらゆる機序で発現する効果 Total Effect Indirect Effect Statin Cholesterol level Direct Effect CHD 4
MEGA Study Management of Elevated Cholesterol in the Primary Prevention Group of Adult Japanese • プラバスタチンによる冠動脈イベント CHD(coronary heart disease)予防効果の検証 を目的とした一次予防試験 • 対象 • CHD既往歴がなく総コレステロール値 220~270 mg/dL の中等度高脂血症患者 • 試験デザイン • オープンラベル・ランダム化試験 食事療法単独群 3966名 追跡5年間 ランダム化 食事療法 + プラバスタチン併用群 3866名 CHD 脳卒中 発症を比較 Nakamura et al. Lancet 2006;368:1155-63 5
CHD発症に対する試験結果(ITT解析) Hazard ratio (95% CI) = 0.70 (0.50-0.97) Log-rank P = 0.03 6
プラバスタチンの作用機序(1) • コレステロール低下作用 • HMG-CoA還元酵素を阻害 • 主に肝臓に分布、コレステロール合成を抑制 • LDL (悪玉)コレステロール減少 • HDL (善玉)コレステロール増加 • 総コレステロール値低下により血管内プラーク(肥厚)安定 7
プラバスタチンの作用機序(2) • Statin’s “pleiotropic” effects • 脂質低下以外の「多面的な」作用 • • • • • 抗炎症反応 内皮機能改善 プラーク退縮 抗血栓作用 … • いずれも動脈硬化性疾患(e.g., CHD)のリスク要因を改善 8
CHD抑制に想定する作用機序 • コレステロール低下を介する間接効果 • 作用機序(1) • コレステロール低下を介さない直接効果 • 作用機序(2) pravastatin Indirect Effect cholesterol level CHD Direct Effect • 媒介分析の出番 • コレステロールが下がっていたからと言って間接効果が大きいとは言えない 9
なぜ媒介分析をおこなうのか 1. 曝露 - アウトカム間の関連を説明して理解するため 2. メカニズムにたいする理論やモデルの確証または反証のため 3. 治療法や介入法を改良するため • 間接効果が大きければ、より中間変数をターゲットに据えた治療開発を • 直接効果が大きければ、治療のコンセプトを練り直す必要がある VanderWeele 2015 “Explanation in Causal Inference: Methods for Mediation and Interaction” 10
なぜ媒介分析をおこなうのか(つづき) 4. 曝露 - アウトカム間に総合効果が認められなくても • 曝露から中間変数への影響、中間変数からアウトカムへの影響の いずれかが弱いのではないか • 直接効果と間接効果が逆方向に作用していないか 5. 曝露には介入できないが、中間変数に介入できる状況 • 曝露の悪影響を、当該中間変数を含むメカニズムを不活化してどの程度 抑えられるのか VanderWeele 2015 “Explanation in Causal Inference: Methods for Mediation and Interaction” 11
従来の媒介分析法(1) • 曝露変数 A • 中間変数 M • 結果変数 Y • 交絡変数 C C A M αM Y αA • Y の回帰モデル E[Y|A, M, C] = α0 + αAA + αMM + αCC 12
従来の媒介分析法(1) • 曝露変数 A • 中間変数 M • 結果変数 Y • 交絡変数 C C A M αM Y αA βA • Y の回帰モデル E[Y|A, M, C] = α0 + αAA + αMM + αCC E[Y|A, C] = β0 + βAA + βCC 13
従来の媒介分析法(1) • “Difference” method E[Y|A, M, C] = α0 + αAA + αMM + αCC E[Y|A, C] = β0 + βAA + βCC • 回帰モデルの係数で 「効果」 を定義 • αA が直接効果 • βA が総合効果 • βA − αA が間接効果 回帰係数の 「解釈」 からの類推による定義にすぎない どういう 「効果」 を求めているのか? 14
従来の媒介分析法(2) • 曝露変数 A • 中間変数 M • 結果変数 Y • 交絡変数 C C A γA M αM Y αA • Y の回帰モデル E[Y|A, M, C] = α0 + αAA + αMM + αCC • M の回帰モデル E[M|A, C] = γ0 + γAA + γCC 15
従来の媒介分析法(2) • “Product” method E[Y|A, M, C] = α0 + αAA + αMM + αCC E[M|A, C] = γ0 + γAA + γCC • 回帰モデルの係数で 「効果」 を定義 • αA が直接効果 • γAαM が間接効果 やはり、どういう意味での 「効果」 なのか? 手法によって 「知りたいもの」 が操作的に決まってしまっている 16
反事実アウトカムモデル • Yia : 曝露が A = a だった場合の対象者 i の潜在アウトカム • 曝露を受けた場合(A = 1): Yi1 • 曝露を受けなかった場合(A = 0): Yi0 • いずれか一方のみ観察され、他方は反事実 Y1 A=1 Y0 A=0 17
中間変数も加えると • Yi a,m : 曝露 A = a, 中間変数 M = m だった場合の潜在アウトカム • (Yi0,0, Yi1,0, Yi0,1, Yi1,1) のうち、観測されるのは1つ • 残りは反事実 同じ A = a 下でも中間変数 Ma の値は 人によって異なる • 総合効果 1 0 E[Y1] – E[Y0] = E[Y1,M ] – E[Y0,M ] • Mia : 曝露 A = a だった場合の潜在中間変数 C A M Y 18
効果の分解 • 総合効果 1 0 E[Y1] – E[Y0] = E[Y1,M ] – E[Y0,M ] 1 0 0 0 = E[Y1,M ] – E[Y1,M ] + E[Y1,M ] – E[Y0,M ] • 自然な間接効果 natural indirect effect • A で変化した M の値(M1 vs. M0)を比較 C A M Y 19
効果の分解 • 総合効果 1 0 E[Y1] – E[Y0] = E[Y1,M ] – E[Y0,M ] 1 0 0 0 = E[Y1,M ] – E[Y1,M ] + E[Y1,M ] – E[Y0,M ] • 自然な直接効果 natural direct effect • M を個人ごとに曝露なし状態での値(M0)に固定して、曝露 A = 1 vs. 0 を比較 C A M Y 20
どうやって求めるのか? 1 0 • 間接効果 : E[Y1,M ] – E[Y1,M ] 0 0 • 直接効果 : E[Y1,M ] – E[Y0,M ] • 絶対に観察できない (cross-world intervention による潜在アウトカム) • 仮定の下で 「識別式」 を導ける • 効果を観察データの確率分布であらわすこと • 仮定 1. 2. 3. 4. 曝露 - 中間変数の交絡変数はすべて測定 曝露 - アウトカムの交絡変数はすべて測定 中間変数 - アウトカムの交絡変数はすべて測定 中間変数 - アウトカムの交絡変数は曝露の影響をうけない 21
直接効果の識別式 0 0 E[Y1,M ] – E[Y0,M ] = Σc Σm {E[Y| A = 1, M = m, C = c] – E[Y| A = 0, M = m, C = c]} ×P(M = m| A = 0, C = c) P(C = c) 以下の回帰モデルを仮定すると E[Y|A, M, C] = α0 + αAA + αMM + αAMAM + αCC E[M|A, C] = γ0 + γAA + γCC = Σc Σm{(α0 + αA + αMm + αAMm + αCc) – (α0 + αMm + αCc)} P(M = m| A = 0, C = c) P(C = c) = Σc Σm{αA + αAMm} P(M = m| A = 0, C = c) P(C = c) = αA + Σc αAM E[M = m| A = 0, C = c] P(C = c) = αA + Σc αAM (γ0 + γCC) P(C = c) = αA + αAM (γ0 + γCE[C]) ☜ 回帰係数の推定値を組み合わせて推定できる 22
間接効果の識別式 1 0 E[Y1,M ] – E[Y1,M ] = Σc Σm E[Y| A = 1, M = m, C = c] ×{P(M = m| A = 1, C = c) – P(M = m| A = 0, C = c)} P(C = c) 以下の回帰モデルを仮定すると E[Y|A, M, C] = α0 + αAA + αMM + αAMAM + αCC E[M|A, C] = γ0 + γAA + γCC = Σc Σm (α0 + αA + αMm + αAMm + αCc) {P(M = m| A = 1, C = c) – P(M = m| A = 0, C = c)} P(C = c) = Σc {Σm(αMm + αAMm) P(M = m| A = 1, C = c) – Σm(αMm + αAMm) P(M = m| A = 0, C = c)}P(C = c) = Σc (αM + αAM){E[M = m| A = 1, C = c] – E[M = m| A = 0, C = c]} P(C = c) = Σc (αM + αAM){(γ0 + γA + γCC) – (γ0 + γCC)} P(C = c) = (αM + αAM)γA ☜ やはり、回帰係数の推定値を組み合わせて推定できる 23
いろいろな状況に対応した解析パッケージ • SAS • CAUSALMED プロシジャ (旧 mediation マクロ) • Stata • paramed コマンド • SPSS • Mediation マクロ •R • CMAverse パッケージ ☞ 重み付け法、シミュレーション法にも対応 • mediation パッケージ ☞ 回帰モデルにもとづくシミュレーションで推定 24
A と M に時間的隔たりをもたせると • 治療 A をランダム化できていても… • 中間変数 M に対する時間依存性交絡 L が一般に存在 • 時間依存性交絡 : 治療後の交絡変数 • しかも、治療の影響を受ける可能性 A M Y L U 25
因果DAG causal directed acyclic graphs • A → L がない場合 • 「自然な」 直接効果と間接効果を識別できる • A → L がある場合 • 「自然な」 直接効果と間接効果は識別できない A M 黒木. 2017 『構造的因果モデルの基礎』 Y L U 26
A → L がある場合の対応策 • (謎の)確率変数 Ga|c • A = a という介入下での M の反事実分布 P(Ma = m|C = c) から ベースライン交絡変数の値 Ci に応じて対象者 i ごとにランダムサンプル • この「ランダムに選ばれた値」に中間変数を固定 • Interventional direct/indirect effects 0|C 1,G E[Y ] • 直接効果 = – • 間接効果 = E[Y1,G ] – E[Y1,G ] 1|C 0|C 0,G E[Y ] 0|C • …なんですかねこれは? 27
2つの世界線 M1 1 Y1,M 総合効果 E[Y1] – E[Y0] M0 0 Y0,M 山室他, 2019年 統計関連学会連合大会より 28
2つの世界線(C = c のサブグループ) 1|c G M1 1 Y1,M G M0 0|c 0 Y0,M 山室他, 2019年 統計関連学会連合大会より 29
3つの世界線(C = c のサブグループ) 1|c G M1 1 0|c 1,G Y Y1,M G M0 0|c 0 Y0,M 山室他, 2019年 統計関連学会連合大会より 30
5つの世界線(C = c のサブグループ) 1|c G M1 1 Y1,M 1|c Y1,G G M0 0 Y0,M 0|c 1,G Y 0|c 0|c 0,G Y 山室他, 2019年 統計関連学会連合大会より 31
5つの世界線(C = c のサブグループ) 1|c G M1 1 Y1,M 1|c Y1,G G M0 0 Y0,M 間接効果 0|c 1,G Y 0|c 直接効果 0|c 0,G Y 山室他, 2019年 統計関連学会連合大会より 32
Interventional effects による解析例 33
J-EDITデータ Japanese Elderly Diabetes Intervention Trial • 高齢者2型糖尿病患者を対象とした治療方針のランダム化比較試験 • 血圧、脂質、血糖、合併症、...etc. に応じた適応的治療 • ガイドライン推奨治療 • 強化治療 • プロトコルでは個別の治療方針を特定せず • アトルバスタチン(コレステロール低下剤)が広く使用 Aged 65–84 yrs and HbA1c ≥ 7.9% w/o co-morbidities 7.4%–7.8% w/ co-morbidities R Intensive treatment n = 588 Conventional treatment n = 585 DM complication and/or CVD events in 6 yrs Araki et al. Geriatr Gerontol Int 2012;12 Suppl 1:7-17 荒木・井藤.日老医誌 2015;52:4-11 34
Atorvastatin treated Subjects with atorvastatin treatment(%) (%) アトルバスタチンの処方割合推移 Intensive treatment group 25 20 15 Conventional treatment group 10 5 0 0 1 2 3 4 5 6 Years after follow-up Years after follow-up • 処方が変化するアトルバスタチンのCVD予防効果 • HR = 0.48 (95% CI: 0.19, 1.16) • 全員が6年間スタチンを受け続けた場合 vs. 全員が6年間一度も受けなかった場合 • 変化する HbA1c、コレステロール指標、血圧指標 を IPTW (inverse probability of treatment weighting) 法で調整 Shinozaki, et al., Geriatrics & Gerontology International 2012 35
アトルバスタチンのCVD予防効果 1. LDLコレステロール低下作用 MI を介する間接効果1 2. 白血球数 MII (抗炎症作用のマーカー) を介する間接効果2 3. それ以外の pleiotropic effects (直接効果) A1 (MI,1 ,MII,1) L1 Y1 A2 (MI,2 ,MII,2) Y2 L2 U 36
Interventional direct/indirect effects 1. LDLコレステロール低下作用 MI を介する間接効果1 2. 白血球数 MII (抗炎症作用のマーカー) を介する間接効果2 3. それ以外の pleiotropic effects (直接効果) Mediational g-formula • パラメトリックモデルとシミュレーションで推定 37
結果 • LDLコレステロール MI を介した間接効果は比較的大きい • 白血球数 MII を介した間接効果は小さい • 炎症マーカーとして感度が悪かった?? 38
まとめ • 因果媒介分析により、効果の 「メカニズム」 に対する推測も不可能 ではなくなってきている • 中間変数への仮想的な介入 • 「もしも治療がなかった場合の中間変数の値に」 • 「メカニズム」 自体が反事実予測の精度を高めるわけではないが… • 介入の定義を広げた反事実予測につながる可能性 • 治療ターゲット (中間変数) を仮想的に変化させた曝露介入の効果 • 中間変数自身への介入を行う場合の効果 •… 39