行列分解を用いたメタアナリシスによる有害事象のパターン抽出

3.5K Views

March 07, 25

スライド概要

複数の臨床試験における個人レベルの有害事象データに対し、構造を工夫した非負行列分解(トピックモデル)を適用し、有害事象パターンや個人レベルの安全性プロファイルを推定する手法の紹介になります。
元論文:Matsuura, K., Tsuchida, J., Ando, S., & Sozu, T. (2021). Matrix decomposition in meta-analysis for extraction of adverse event pattern and patient-level safety profile. Pharmaceutical Statistics, 20(4), 806–819.

profile-image

興味:統計モデリング, 強化学習, 因果推論, Stan, R, Python, 理工学書, 教育。主な著書は『StanとRでベイズ統計モデリング』。技術的なブログ, 本, 論文, QAサイトの回答を書いている人が好き。なぜならそれらで独習することが多かったから。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

行列分解を用いたメタアナリシスによる 有害事象のパターン抽出 2025.3.7 松浦 健太郎

2.

2 Introduction

3.

有害事象とは • 病気による症状と治療の副作用による症状を合わせた事象を 有害事象 (Adverse Event, 以降AE)と呼ぶ • 実際には副作用と断言できることは少ないため、臨床試験では有 害事象を記録する 3

4.

本研究の目的 • 臨床試験におけるAEの評価の目的は、主に次の2つがある: • 治療によって 目的① どのようなAEパターンが出現しやすくなるかを知る 目的② 各患者で、どのAEパターンが出現しやすいかを知る 本研究の目的は、目的①と目的②を同時に実現する統計モデルの構築 である 4

5.

従来の評価例 • 集団レベルの評価: • AEの出現回数の集計・検定 • ポアソン回帰, ロジスティック回帰 患者レベルで評価できない • 患者レベルの評価: • 患者情報を予測因子とした回帰、機械学習の手法 アウトカム(AE)の数が多い場合をうまく扱えない AE間の共起関係を考慮していない 5

6.

非負行列分解 • 共起関係を考慮した統計モデルとして非負行列分解がある • 行列分解してランクの小さな行列の積で行列を近似することで 解釈を容易にし、ノイズを減らし、予測を向上させる利点がある 6

7.

非負行列分解の例 • 4人の患者について、治療によって生じた5種類のAEを数えて、 出現頻度行列で表現する パターンの数を2と仮定して行列分解 患者 1 患者 2 患者 3 患者 4 1 1 0 0 2 1 0 0 0 1 1 1 1 0 2 1 0 0 ≈ 1 0 2.4 0.7 2.4 0 0 2.7 0 1.4 患者ごとに、どのAEパターンを どれほど持っているか (安全性プロファイル) 便秘・口内炎パターン 0.4 0.6 0.2 0 0 0 0 0.4 0.8 0.2 吐き気・嘔吐パターン すべての患者で共通の AEパターン 7

8.

提案法 8 • 次の①~③を仮定して行列分解を拡張 ① 出現頻度行列は、試験に由来する行列と治療に由来する行列に分離できる ② AE名が同じでGradeの差が1のとき、度数が似ている ③ 治療の作用機序が同じならAEパターンが似ている ・・・ 𝐾パターン ~ ① + 試験(疾病など)由来 ・・・ = 治療由来 + ③ 似ている ② 似ている 似ている 別の治療

9.

9 Method

10.

データ例① 臨床試験と患者数 10 • 統計モデルが複雑なため、データ例の説明からはじめる • Project Data Sphereの118, 120, 127の3試験を使った • 乳癌患者に対する抗がん剤(化学療法)の臨床試験で、 人数が上位3つのPhase III試験を選択 • 治療や患者の詳細は少し異なるが、今回はその違いの影響は小さいと考えた • 患者数の合計は約3300人

11.

データ例② AEの種類と出現数 • AE名と重症度の組み合わせをAE typeと定義した • 例 “NAUSEA_1” • AE typeの数:約850種類 • AE typeの出現回数:約10万回 (~1人あたり約30回) 11

12.

各群の要約とperiodの定義 患者数 Baseline dataの有無 1625 有 120 𝑠 = 2 FAC 731 A→CMF 480 127 𝑠 = 3 AC→CMF 481 - 試験番号 群 118 𝑠 = 1 AC→T 12 前半の治療 𝑝 = 1 AC (4) 𝑝=2 FAC (6) 𝑝 = 4 後半の治療 T (4) 𝑝=3 - 有 𝑝 = 5 A (4) 𝑝=6 CMF (3) 𝑝 = 7 有 𝑝 = 8 AC (4) 𝑝=9 CMF (3) 𝑝 = 10 登録から治療開始までに生じたAEのデータ • • • • • A: doxorubicin C: cyclophosphamide F: 5-fluorouracil M: methotrexate T: docetaxel 括弧内の数値はサイクル数 (治療にもよるが1サイクルが3週間ぐらい) 核酸合成阻害 有糸分裂阻害

13.

periodごとにAEの出現行列を作成する 𝑠 患者数 Baseline dataの有無 1 1625 有 𝑁𝑝 人の患者 𝑝=1 前半の治療 AC (4) 𝒀1 例: 𝑁1 = 1625 𝐽 = 848個のAE type 𝒀2 𝑝=2 後半の治療 T (4) 𝑝=3 𝒀3 13

14.

𝑌𝑖𝑗 はPoisson分布に従うとする 𝑠 患者数 Baseline dataの有無 1 1625 有 𝑝=1 前半の治療 AC (4) 𝒀1 𝒀2 𝑝=2 後半の治療 𝑝=3 T (4) 𝒀3 ~ ~ ~ 𝝀1 𝝀2 𝝀3 𝑌𝑖𝑗 ~ Poisson 𝐶𝑖 𝜆𝑖𝑗 𝑖 = 1, … , 𝑁 𝑗 = 1, … , 𝐽 𝐶𝑖 は患者𝑖の投与期間を表す定数 14

15.

𝝀は試験と治療の項に分離できると仮定する 𝑠 患者数 Baseline dataの有無 1 1625 有 𝑝=1 前半の治療 AC (4) 𝒀1 𝒀3 + 𝜷 AC ~ ~ 試験(study)の効果 𝜶 𝑝=3 T (4) 𝒀2 ~ 𝜶 𝑝=2 後半の治療 𝜶 + 𝜷T 治療(treatment)の効果 15

16.

𝜶と𝜷は低ランクの行列の積で表現できると仮定する 16 𝑠 患者数 Baseline dataの有無 1 1625 有 前半の治療 AC (4) 𝑝=1 𝒀1 𝒀3 ~ + 𝜷 AC 𝜶 𝝃 + 𝜷T = = = 𝜼 𝑝=3 T (4) ~ ~ 𝜶 𝜼 𝐿パターン 𝑝=2 𝒀2 𝜶 𝝃 後半の治療 𝜼 𝝓 AC + 𝜽 AC 𝐾パターン 𝝃 𝝓T +𝜽 T 𝐾パターン

17.

メカニズムが同じ治療のAEパターンは似ていると仮定する 𝜼 𝑝=1 𝜼 𝑝=2 𝝃 𝝃 𝜼 𝝓 AC 𝑝=3 𝝃 + 𝜽 AC 𝝓T +𝜽 T 有糸分裂阻害 𝝓 FAC 𝑝=4 𝜼 𝑝=5 𝜼 𝑝=6 𝝃 𝝃 𝜼 𝑝=8 𝝃 𝜽 FAC 𝜼 𝝓A 𝑝=7 +𝜽 A 𝜼 𝑝=9 𝝃 核酸合成阻害 + 𝜽 CMF 𝝃 𝜼 𝝓 AC + 𝜽 AC 𝝓 CMF 𝑝 = 10 𝝃 𝝓 CMF +𝜽 CMF 17

18.

メカニズムが同じ治療のAEパターンは似ていると仮定する 𝐽 𝐾 𝝓 AC = softmax (核酸合成阻害) 𝐌𝑘 + 𝐑 𝑘AC メカニズムに由来する効果 (固定効果) 治療薬に由来する効果 (変量効果) 核酸合成阻害: AC, FAC, A, CMF 有糸分裂阻害: T 核酸合成阻害: AC FAC A CMF 18

19.

𝑴, 𝑹は重症度を反映する • AE名が同じで重症度が隣同士のAE typeは, AEパターンもある程度 似ていると仮定する 𝐽 𝐾 (核酸合成阻害) 𝐌𝑘 𝑀𝑘𝑗 ′ ~ 𝒩 𝑀𝑘𝑗 , 𝜎𝐺2 𝑗, 𝑗′ ∈ 𝒥 ただし, AE type 𝑗と𝑗′は AE名が同じで重症度が隣同士 • 𝑹も同様 19

20.

その他の部分 • 病気に由来する出現強度行列𝜶 𝑠 に関しても 𝜶 𝑠 = 𝝃 𝑠 𝜼 𝑠 と行列分解する • 𝜼 𝑠 もsoftmax関数で定める: 𝛈𝑙 𝑠 = softmax 𝐒𝑙 𝑠 • 𝑘 = 1, … , 𝐾 について、重症度が最小のAE type (𝑗 ∈ 𝔍)は平均0の正規分布に従うとした: • (softmax関数は引数が𝑣𝑗 → 𝑣𝑗 + 𝑐と平行移動しても出力𝑢𝑗 は不変であるため) 𝑚 2 𝑀𝑘𝑗 ~ 𝒩 0, 𝜎𝑀 • 𝑹 𝑡 と𝑺 𝑠 についても𝑴 𝑚 と同じ仮定を置いた: 𝑡 𝑡 𝑘 = 1, … , 𝐾 𝑗, 𝑗 ′ ∈ 𝒥 𝑠 𝑠 𝑙 = 1, … , 𝐿 𝑗, 𝑗 ′ ∈ 𝒥 • 𝑅𝑘𝑗 ′ ~ 𝒩 𝑅𝑘𝑗 , 𝜎𝐺2 • 𝑆𝑙𝑗 ′ ~ 𝒩 𝑆𝑙𝑗 , 𝜎𝐺2 • 𝑅𝑘𝑗 ~ 𝒩 0, 𝜎𝑅2 • 𝑆𝑙𝑗 ~ 𝒩 0, 𝜎𝑆2 𝑡 𝑘 = 1, … , 𝐾 𝑗 ∈ 𝔍 𝑠 𝑙 = 1, … , 𝐿 𝑗 ∈ 𝔍 • 𝜽 𝑡 と𝝃 𝑠 は以下のように変数変換して非負にした: ෩𝑡 • 𝜽 𝑡 = exp 𝜽 • 𝝃 𝑠 = exp 𝝃෨ 𝑠 𝑗∈𝔍 20

21.

推定方法 21 • 背景知識からパターン数と事前分布の形状を定めた: • 𝐾 = 15, 𝐿 = 2, 𝜎𝐺 = 1.5, 𝜎𝑀 = 5, 𝜎𝑅 = 0.5 パターン数 データが豊富なら推定も可能 • 全体の対数事後確率: • L-BFGS法によるMAP推定 (点推定)で推定した 21

22.

予測方法 22 • 治療ACを受ける新規患者𝑖 ′ に対し、ある時点までにカウントしたAE typeの出 現回数(𝐘𝑖 ′ )から、将来出現するAE typeを予測したい AC 𝛉𝑖 ′ 𝐘𝑖 ′ ~ 𝜶 + 𝝓 AC 推定した𝝓 AC を十分に真値に近いと 考えて固定する 𝜶は十分に小さいと仮定する AC • すると、以下の対数事後確率を最大化することで𝛉𝑖 ′ 𝐽 𝐾 AC ෍ log Poisson 𝑌𝑖 ′ 𝑗 ቮ𝐶𝑖 ′ ෍ exp 𝜃෨𝑖 ′ 𝑘 𝑗=1 AC • 𝛉𝑖 ′ を推定できる: AC 𝜙𝑘𝑗 𝑘=1 と𝝓 AC から𝜆𝑖 ′𝑗 を算出し、値の高い順にAE typeを列挙すればよい

23.

23 Result

24.

結果の概要 24 • 提案手法をデータ例に適用し、動作特性を確認した 以下の3つを順に説明する ① 𝝓 𝑡 の例: • 治療ACのAEパターン𝝓 AC を取り上げ、背景知識と一致するか確認した ② 𝜽 𝑡 の例: • 2サイクル終了時と4サイクル終了時における患者の安全性プロファイルの例 ③ 予測の例

25.

結果① 治療ACのAEパターン𝝓 AC 25 • 事後確率への貢献が大きい上位7パターンを示す(数値は出現の強さで合計100) • 各パターンで出現しやすいAE (1.0以上, Grade 3以上は0.1以上) パターン番号 AEタイプ 出現強度 1 吐き気_1 99.9 嘔吐_2 44.7 吐き気_2 42.4 嘔吐&吐き気 2 嘔吐_3 6.2 パターン 吐き気_3 6.0 嘔吐_4 0.4 3 無力症_1 99.9 便秘_1 53.7 口内炎_2 23.6 便秘&口内炎 体重増加_1 17.6 パターン 4 体重増加_2 1.8 感染_2 1.3 口内炎_3 0.6 5 嘔吐_1 99.8 パターン番号 AEタイプ 出現強度 味覚倒錯_1 22.5 下痢_1 19.4 不眠症_1 16.8 流涙_1 13.9 月経障害_1 13.2 6 皮膚乾燥_1 4.7 発熱_1 3.3 咽頭炎_1 1.9 痒み_1 1.0 口内炎_3 0.1 神経障害 パターン1 パターン番号 AEタイプ 出現強度 吐き気_2 46.1 爪の変性_1 24.6 血管拡張_2 13.9 拒食症_2 6.3 7 腹痛_2 2.7 爪の変性_2 1.7 体重減少_1 1.4 拒食症_3 0.3 体重減少_3 0.1 神経障害 25 パターン2

26.

結果② 3名の患者の安全性プロファイル • 前半2サイクル終了時点のパターン成分 • 患者1のように複数のパターン成分を持つ患者もいれば、患者2のように少数 のパターン成分を持つ患者もいる 26

27.

結果② 3名の患者の安全性プロファイル • 前半2サイクル終了時点と4サイクル終了時点のパターン成分 • 患者1と2では、2サイクル終了時と4サイクル終了時のパターン成分の値が近 く、AEの出現傾向が時間とともに大きく変わっていないことを示す • 患者3のように、出現傾向が変化する患者も存在する 27

28.

結果③ 患者レベルの予測の例 • 前半2サイクル終了時に、後半2サイクルで 出現頻度が高いと予測された上位20個を示す AC • 具体的には𝜆1069,𝑗 の上位20個 • 数値は1サイクルあたりの頻度 ●:実際に出現したAE ●:前半には出現しなかったが 予測されて後半に出現したAE AEタイプ 28 予測出現頻度 吐き気_1 0.67 無力症_1 0.67 便秘_1 0.36 味覚倒錯_1 0.36 口内炎_1 0.33 下痢_1 0.31 不眠症_1 0.26 流涙_1 0.22 血管拡張_1 0.21 月経障害_1 0.21 拒食症_1 0.20 口内炎_2 0.16 消化不良_1 0.16 月経障害_3 0.14 痛み_1 0.14 体重増加_1 0.12 腹痛_1 便秘_2 皮膚乾燥_1 感染_3 0.10 0.09 0.07 0.07

29.

要約 • 本発表で提案した統計モデルによって、AEパターンと患者レベルの安全性プ ロファイルの抽出ができることを示した • 抽出された治療特有のパターンは医学的な背景知識とある程度一致していた • 抽出されたそれらを治療方針のサポートや将来のAEの定量的な予測に利用で きる可能性を示した 29

30.

References • Matsuura, K., Tsuchida, J., Ando, S., & Sozu, T. (2021). Matrix decomposition in meta-analysis for extraction of adverse event pattern and patient-level safety profile. Pharmaceutical Statistics, 20(4), 806–819. 30

31.

31 Appendix

32.

添字の詳細 32 • 以降の説明のため、𝑝と𝑠𝑝 の通し番号を振る • 期間(period)の通し番号 𝑝 = 1, … , 10 • 試験(study)の通し番号 𝑠𝑝 ∈ 1,2,3 ➔期間が決まれば試験が決まる (例: 𝑠6 = 3) Treatment AC FAC A CMF T index 𝑡 1 2 3 4 5 index 𝑚 1 1 1 1 2 • 以降の説明のため、上記のように通し番号を振る • 治療の通し番号 𝑡𝑝 ∈ 1, . . , 5 • 作用機序の通し番号 𝑚𝑡𝑝 ∈ 1,2 ➔期間が決まれば治療が決まり、作用機序が決まる 例: 𝑡6 = 3, 𝑚3 = 1

33.

AEに関するその他の情報 • 試験がやや古いので, 使用した患者レベルのAEの情報はCOSTART となっている (MedDRAではない) • 階層が最も下のレベルのAE名を用いた • 脱毛 (alopecia) は75%以上の患者で長い期間にわたって出現して いるので、以降の解析から除外した 33

34.

AE type AEデータの例 (試験118の患者𝑖) 34 𝑝=1 𝑝=2 𝑝=3 0 2 4 𝑝 𝑌𝑖𝑗 VISIT

35.

主成分分析との関係 • 𝜽と𝝓が直交行列の場合は主成分分析と等価である • しかし、次のような欠点がある: 直交行列の制約が強いため、𝒀の近似がうまくいかない ポアソン分布の平均𝜆𝑖𝑗 が負になることがあるため、解釈が困難 35