9.3K Views
May 24, 22
スライド概要
⾮劣性試験の⼊⾨ 奥村泰之 ⼀般財団法⼈ 医療経済研究・社会保険福祉協会 医療経済研究機構 研究部 主任研究員 臨床疫学研究における報告の質向上のための統計学の研究会 第29回研究集会 2017/5/20 (⼟) 14:30~17:45 東京医科⻭科⼤学 湯島キャンパス 1号館⻄7階 ⼝腔保健学科第3講義室
発表構成 ⾮劣性試験とは ⾮劣性マージンの定め⽅ ⾮劣性の検討法 Rによる例数設計法 2
⾮劣性試験とは
無作為化⽐較試験 (RCT) の型 現在 未来 アウトカム測定 実験群 対照群 無作為化 症例登録 4
優越性試験 (superiority trial) 対照群に対する実験群の優越性 「優れている」 と判断する限界値 E is better Lesaffre E: Bull NYU Hosp Jt Dis. 2008;66(2):150-4. 0 C is better 5
⾮劣性試験 (noninferiority trial) 標準的介⼊に対する試験的介⼊の⾮劣性 「劣っていない」 と判断する限界値 T is better Lesaffre E: Bull NYU Hosp Jt Dis. 2008;66(2):150-4. 0 S is better 6
⾮劣性試験を使う理由 有効な介⼊があるため,プラセボ対照試 験が⾮倫理的である[1] 数多くの有効な薬があり,その組み合わ せによって,種類・⽤量・時期の異なる 様々な治療戦略がある[2] [1] Non-inferiority clinical trials to establish effectiveness (https://www.fda.gov/downloads/Drugs/Guidances/UCM202140.pdf) [2] Landewé R, van der Heijde D: Curr Opin Rheumatol. 2016 May;28(3):316-22. 7
⾮劣性試験を実施する前提, 標準的介⼊に対する試験的介⼊のメリット 利⽤可能性が⾼い 費⽤が安い 侵襲性が低い 有害事象が少ない 実施が容易 Piaggio G et al: JAMA. 2012 Dec 26;308(24):2594-604. 8
⾮劣性試験を実施できない状況 標準的介⼊の有効性が⼩さいため,⾮劣性試 験で必要な標本サイズが現実的ではない 標準的介⼊の有効性について,研究間の異質 性が⼤きい ⾮劣性マージンを決定するために必要なエビ デンスがない 標準的介⼊の有効性を検討した時代と,医療 ⽔準が⼤きく異なる Non-inferiority clinical trials to establish effectiveness (https://www.fda.gov/downloads/Drugs/Guidances/UCM202140.pdf) 9
論⽂数,増加傾向 400 300 200 100 0 1998 2000 2002 2004 2006 2008 2010 2012 2014 2016 出版年 PubMed検索式: (noninferiority[tiab] OR non-inferiority[tiab]) AND randomized controlled trial[pt] 10
ハイ・インパクトの⾮劣性試験 (IF >10; n=168) 低いガイドライン遵守率 45.8 非劣性マージンの合理性の記述 60.1 ITT解析とPP解析の実施 56.5 有意水準と信頼限界の一致 33.3 欠測値処理法の記述 38.1 感度分析の実施 0 10 20 30 遵守率 Rehal S et al: BMJ Open. 2016 Oct 7;6(10):e012594. 40 50 60 11
⾮劣性マージンの定め⽅
⾮劣性マージン (δ) 「劣っていない」 と判断する限界値 T is better 0 δ S is better 13
⾮劣性マージンとは 試験的介⼊と標準的介⼊の間の,臨床的 に許容できる最⼤の差[1] ⾮劣性試験により統計的に棄却するよう 試みる,標準的介⼊に対して試験的介⼊ が劣っている程度[2] [1] Non-inferiority clinical trials to establish effectiveness (https://www.fda.gov/downloads/Drugs/Guidances/UCM202140.pdf) [2] Choice of control group and related issues in clinical trials (https://www.pmda.go.jp/files/000156803.pdf) 14
統計的検定,帰無仮説 試験的介⼊は標準的介⼊よりδ以上劣る T Sδ ⾮劣性 マージン (δ) 悪化 改善 試験的介⼊の アウトカム(T) Ng TH: Noninferiority testing in clinical trials issues and challenges. 2015. 標準的介⼊の アウトカム(S) 15
統計的検定,対⽴仮説 試験的介⼊は標準的介⼊よりδ未満劣る T Sδ ⾮劣性 マージン (δ) 悪化 改善 試験的介⼊の アウトカム(T) Ng TH: Noninferiority testing in clinical trials issues and challenges. 2015. 標準的介⼊の アウトカム(S) 16
⾮劣性マージン (δ) の定め⽅, 係数 (ε) と標準的介⼊の効果 (S-P) を設定 主観的に係数を 設定 先⾏研究からプラセボに対する 標準的介⼊の効果を設定 Ng TH: Noninferiority testing in clinical trials issues and challenges. 2015. 17
係数(ε)>1,標準的介⼊と⽐べて劣っていな くても,プラセボより劣ることがある δ 1.1S P ⾮劣性マージン (δ) 悪化 試験的介⼊の アウトカム(T) 改善 プラセボの アウトカム(P) Ng TH: Noninferiority testing in clinical trials issues and challenges. 2015. 標準的介⼊の アウトカム(S) 18
係数(ε)>0.5,標準的介⼊と⽐べて劣っていな くても,些末な効果しかないことがある δ 0.9S P ⾮劣性マージン (δ) 悪化 改善 プラセボの アウトカム(P) 試験的介⼊の アウトカム(T) Ng TH: Noninferiority testing in clinical trials issues and challenges. 2015. 標準的介⼊の アウトカム(S) 19
保持率(1-ε)の意味,試験的介⼊の効果, 標準的介⼊の効果の~%超を保持 効果の保持率 T P 1 ε S P プラセボに対する 試験的介⼊の効果 プラセボに対する 標準的介⼊の効果 Ng TH: Noninferiority testing in clinical trials issues and challenges. 2015. 20
⾼い保持率の関連要因 アウトカムの重要性 死亡 vs 治療の失敗 標準的介⼊のリスクの低さ (死亡率) 10% vs 30% 試験的介⼊のメリット 費⽤が安い vs 有害事象が少ない Gayet-Ageron A et al: J Clin Epidemiol. 2015 Oct;68(10):1144-51. 21
保持率の定め⽅,主観を伴う, δ [1] [2] 慣例50% ,抗⽣剤90% 85 0.0 80 0.0 75 固定マージン法 (n=13) 点推定法 (n=30) 7.7 3.3 3.3 7.7 7.7 6.7 70 保持率 ε S P 67 0.0 60 0.0 55 0.0 10.0 6.7 3.3 50 46.7 45.65 0.0 44 0.0 20 0.0 15.82 0.0 0 3.3 3.3 3.3 7.7 10.0 0 53.8 10 15.4 20 30 40 50 [1] Althunian TA et al: Trials. 2017 Mar 7;18(1):107. doi: 10.1186/s13063-017-1859-x [2] Althunian TA et al: Br J Clin Pharmacol. 2017 Mar 2. doi: 10.1111/bcp.13280 60 22
標準的介⼊の効果の定め⽅, δ ⾮劣性の検討法による ε S P 固定マージン法 (fixed-margin method) 先⾏研究からプラセボに対する標準的介⼊の 有効性の推定値の下限値を設定する 点推定値法 (point-estimate method) 先⾏研究からプラセボに対する標準的介⼊の 有効性の推定値を設定する 統合法 (synthesis method) 標準的介⼊の効果を定める必要がない Althunian TA et al: Trials. 2017 Mar 7;18(1):107. doi: 10.1186/s13063-017-1859-x 23
先⾏研究が複数ある場合① ケース① 各研究は標準的介⼊の有効性を⽀持している 効果の⼤きさは研究間で⼀貫している メタアナリシスにより効果推定値を統合 ケース② 複数の⼩さな先⾏研究がある ⼀部は標準的介⼊の有効性を⽀持していない 異質性に注意を払い メタアナリシスにより効果推定値を統合 Non-inferiority clinical trials to establish effectiveness (https://www.fda.gov/downloads/Drugs/Guidances/UCM202140.pdf) 24
先⾏研究が複数ある場合② ケース③ 複数の⼤きな先⾏研究がある ⼀部は標準的介⼊の有効性を⽀持していない 有効性が否定的となる理由を説明できない限り ⾮劣性試験を⾏うことに疑問が残る ケース④ 同⼀薬剤クラスで複数の薬剤の研究がある 薬剤間で効果の⼤きさが⼀貫してない メタアナリシスによる効果推定値を統合し 効果の⼤きな薬剤を標準的介⼊とする Non-inferiority clinical trials to establish effectiveness (https://www.fda.gov/downloads/Drugs/Guidances/UCM202140.pdf) 25
分析感度*(assay sensitivity),⾮劣性試験の必要条件 *無効な介⼊と有効な介⼊を弁別する能⼒ 適切に計画・実施された先⾏研究において プラセボに対する標準的介⼊の有効性が⽰されている ⾮劣性試験においてバイアス (e.g., ⽋測バイアス) を 最⼩化するよう質が担保されている 先⾏研究と⾮劣性試験が類似している (不変性の仮定) Non-inferiority clinical trials to establish effectiveness (https://www.fda.gov/downloads/Drugs/Guidances/UCM202140.pdf) 26
不変性の仮定 (constancy assumption) SP SP ⾮劣性試験における プラセボに対する 標準的介⼊の効果 (未知) h 先⾏研究における プラセボに対する 標準的介⼊の効果 Ng TH: Noninferiority testing in clinical trials issues and challenges. 2015. 27
不変性の仮定,先⾏研究との類似性 患者の特性 重要な併⽤療法 アウトカムの定義 標準的介⼊の内容 適格基準 分析⼿法 Non-inferiority clinical trials to establish effectiveness (https://www.fda.gov/downloads/Drugs/Guidances/UCM202140.pdf) 28
割引率(discounting), 不変性の仮定の逸脱への対処法 SP SP 割引率 (0~1) h 先⾏研究における プラセボに対する 標準的介⼊の効果 Ng TH: Noninferiority testing in clinical trials issues and challenges. 2015. 29
⾮劣性の検討法
⾮劣性の検討法,3種類 FDAは固定マージン法を推奨 名称 概要 固定マージン法 ①研究計画段階に,⾮劣性マージン (保持 率と標準的介⼊の効果) を設定 ②⾮劣性試験の結果から仮説検定 点推定法 統合法 標準的介⼊の効果について,不確実性を考 慮しないことを除いて,固定マージン法と 同⼀ ①研究計画段階に,保持率を設定 ②先⾏研究と⾮劣性試験の結果を統合 Non-inferiority clinical trials to establish effectiveness (https://www.fda.gov/downloads/Drugs/Guidances/UCM202140.pdf) 31
英語表記 fixed-margin method 95%-95% method confidence interval method indirect confidence interval comparison method 32
解析の⼿順 ①標準的介⼊の効果の推定 (リスク差/リスク⽐/オッズ⽐/平均値差/平均値⽐/ハザード⽐) ②標準的介⼊の効果の設定 ③保持率の設定と⾮劣性マージンの算出 ④解釈の整理 ⑤試験的介⼊の効果推定と仮説検定 33
背景,⼈⼯膝関節置換術後, 30%~40%に静脈⾎栓症 Lassen MR et al: N Engl J Med. 2009 Aug 6;361(6):594-604. 34
標準的介⼊ (⾎栓予防) のデメリット 注射薬 (ヘパリン) 慎重な⽤量調整 (ビタミンk拮抗薬) わずらわしい (医療機器) Lassen MR et al: N Engl J Med. 2009 Aug 6;361(6):594-604. 35
ADVANCEー1, ⼈⼯膝関節置換術後の⾎栓予防 P : ⼈⼯膝関節置換術を施⾏予定の患者 I : 経⼝薬アピキサバンと注射プラセボ (試験的介⼊) C : 注射薬エノキサパリンと経⼝プラセボ (標準的介⼊) O: 深部静脈⾎栓症+⾮致死的肺塞栓+全死亡 T : 予定された治療期間 (術後10~14⽇) Lassen MR et al: N Engl J Med. 2009 Aug 6;361(6):594-604. 36
①標準的介⼊のリスク差の推定 エノキサパリン vs プラセボ Study 1986-Turpie 1992-Leclerc 1996-Kalodiki 1997-Samama Random effects model Placebo Standard Events Total Events Total 6 11 12 11 50 65 32 78 21 37 13 28 225 δ ε S P Risk Difference 50 64 14 75 203 RD 95% -CI -0.30 -0.41 -0.55 -0.23 [-0.46; -0.14] [-0.56; -0.26] [-0.77; -0.34] [-0.37; -0.10] -0.36 [-0.49; -0.23] Heterogeneity: I-squared=59.1%, tau-squared=0.0098, p=0.0621 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 S is better Wangge G et al: CMAJ. 2013 Feb 19;185(3):222-7. P is better 37
②標準的介⼊のリスク差, 効果推定値の下限に設定 Study 1986-Turpie 1992-Leclerc 1996-Kalodiki 1997-Samama Random effects model Placebo Standard Events Total Events Total 6 11 12 11 50 65 32 78 21 37 13 28 225 δ ε S P Risk Difference 50 64 14 75 203 RD 95% -CI -0.30 -0.41 -0.55 -0.23 [-0.46; -0.14] [-0.56; -0.26] [-0.77; -0.34] [-0.37; -0.10] -0.36 [-0.49; -0.23] Heterogeneity: I-squared=59.1%, tau-squared=0.0098, p=0.0621 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 S is better Wangge G et al: CMAJ. 2013 Feb 19;185(3):222-7. P is better 38
③保持率の設定と ⾮劣性マージンの算出 δ ε S P 1−ε=0.67 δ=(1−0.67)×−0.23=−0.08 Wangge G et al: CMAJ. 2013 Feb 19;185(3):222-7. 39
④解釈の整理 値が⼤きいと標準的介⼊が優れているよう解 釈するため,−0.08から0.08に変換 1. 試験的介⼊は優れている 2. 試験的介⼊は劣っていない 3. ⾮劣性は不確実である 4. 試験的介⼊は劣っている -0.2 T is better -0.1 0.0 リスク差 δ 0.1 0.2 S is better 40
⑤試験的介⼊のリスク差の推定と仮説検定 9.0% (試験的介⼊)−8.8% (標準的介⼊)=0.1% (95%CI: −2.2%, 2.5%) 試験的介⼊は劣っていない 0.00 [-0.02; 0.02] -0.2 T is better -0.1 0.0 リスク差 Wangge G et al: CMAJ. 2013 Feb 19;185(3):222-7. δ 0.1 0.2 S is better 41
①標準的介⼊のリスク⽐の推定 δ ε S P エノキサパリン vs プラセボ Study 1986-Turpie 1992-Leclerc 1996-Kalodiki 1997-Samama Random effects model Risk Ratio Standard Placebo Events Total Events Total 6 11 12 11 50 65 32 78 21 37 13 28 225 50 64 14 75 203 RR 95% -CI 0.29 0.29 0.40 0.38 [0.13; 0.65] [0.16; 0.52] [0.25; 0.65] [0.20; 0.70] 0.35 [0.26; 0.47] Heterogeneity: I-squared=0%, tau-squared=0, p=0.7717 0.2 S is better Wangge G et al: CMAJ. 2013 Feb 19;185(3):222-7. 0.5 1 2 5 P is better 42
②標準的介⼊のリスク⽐, 効果推定値の下限に設定 Study 1986-Turpie 1992-Leclerc 1996-Kalodiki 1997-Samama Random effects model Risk Ratio Standard Placebo Events Total Events Total 6 11 12 11 50 65 32 78 21 37 13 28 225 δ ε S P 50 64 14 75 203 RR 95% -CI 0.29 0.29 0.40 0.38 [0.13; 0.65] [0.16; 0.52] [0.25; 0.65] [0.20; 0.70] 0.35 [0.26; 0.47] Heterogeneity: I-squared=0%, tau-squared=0, p=0.7717 0.2 S is better Wangge G et al: CMAJ. 2013 Feb 19;185(3):222-7. 0.5 1 2 5 P is better 43
③保持率を設定と ⾮劣性マージンの算出 δ ε S P 1−ε=0.67 log(δ)=(1−0.67)×log(0.46)=−0.25 δ=exp(−0.25)=0.78 リスク⽐やハザード⽐は 対数を式に適⽤する Wangge G et al: CMAJ. 2013 Feb 19;185(3):222-7. 44
④解釈の整理 値が⼤きいと標準的介⼊が優れているよう解 釈するため,0.78から1.28 (1/0.78) に変換 1. 試験的介⼊は優れている 2. 試験的介⼊は劣っていない 3. ⾮劣性は不確実である 4. 試験的介⼊は劣っている 0.5 T is better 1.0 リスク比 δ 1.5 2.0 S is better 45
⑤試験的介⼊のリスク⽐の推定と仮説検定 9.0% (試験的介⼊)/8.8% (標準的介⼊)=1.02 (95%CI: 0.78, 1.32) ⾮劣性は不確実である 1.02 [0.78; 1.32] 0.5 T is better 1.0 リスク比 Wangge G et al: CMAJ. 2013 Feb 19;185(3):222-7. δ 1.5 2.0 S is better 46
⽐と差の違い ⾮劣性試験では⽐か差により 検定結果が異なることがある 特徴 ⽐ 差 先⾏研究におけるプラセボに対する標準的 介⼊の効果の変動への頑健性[1] ○ × 先⾏研究と⾮劣性試験におけるアウトカム 発現率の相違への頑健性[2] ○ × 患者への治療意思決定との関係性[3] △ ○ リスクとベネフィットのトレードオフの解 釈可能性[3] △ ○ [1] Althunian TA et al: Br J Clin Pharmacol. 2017 Mar 2. doi: 10.1111/bcp.13280 [2] Kaul S, Diamond GA: Ann Intern Med. 2006 Jul 4;145(1):62-9. [3] Wangge G et al: CMAJ. 2013 Feb 19;185(3):222-7. 47
Rによる例数設計法
帰無仮説と対⽴仮説 H0 : T S δ VS. H1 : T S δ 49
有意⽔準と信頼区間の対応 ⾮劣性試験の仮説は⽚側検定 有意⽔準 信頼区間 ⽚側2.5% 両側95% or ⽚側97.5% ⽚側5.0% 両側90% or ⽚側95% 50
事例,リスク差の例数設計 » Our sample size calculation was based on the primary efficacy endpoint, all-cause mortality in the ITT population from first dose of study drug to day 42. Roughly 255 patients per group were required for an 80% power to demonstrate that the upper limit of the 95% CI for a treatment difference was 10% or less (prespecified non-inferiority margin for this endpoint). This calculation was based on a one-sided, largesample, normal-approximation and non-inferiority test at a 2·5% significance level. A 20% mortality rate was assumed for both drugs in the primary efficacy population. Maertens JA et al: Lancet. 2016 Feb 20;387(10020):760-9. 51
Rによるリスク差の例数設計 » library(gsDesign) » nBinomial ( p1=⺟集団における群1のイベント発⽣率, p2=⺟集団における群2のイベント発⽣率, delta0=⾮劣性マージン, alpha=有意⽔準 (⽚側2.5%), beta=1-検定⼒ ) 52
事例,平均値差の例数設計 » We calculated the sample size for a one-sided Student’s t test with a significance level of 2·5% and a power of 80% based on the clinically determined non-inferiority margin for a difference in BMI of 0·75 kg/m², assuming a SD of 1·45 (appendix). This procedure led to a required sample size of 60 patients per group. Assuming a drop-out rate of 30%,[ref] we calculated a sample size of 85 patients per treatment group. Herpertz-Dahlmann B et al: Lancet. 2014 Apr 5;383(9924):1222-9. 53
Rによる平均値差の例数設計 » library(gsDesign) » nNormal( delta1=⾮劣性マージン, delta0=⺟集団平均値差 (デフォルトは0 [同等を想定]), sd=プールした標準偏差, alpha=有意⽔準 (⽚側2.5%), beta=1-検定⼒ ) 54
⾮劣性マージンが広いほど, 必要症例数が⼩さい 2000 1500 1000 500 必要症例数 2500 3000 p1=.4, p2=.4, beta=.2, alpha=.025 0.05 0.10 0.15 非劣性マージン 0.20 55
標準的介⼊に対する試験的介⼊の効果が ⼤きいほど,必要症例数が⼩さい 4000 2000 必要症例数 6000 8000 p1=.4, delta=0.05, beta=.2, alpha=.025 0.38 0.40 0.42 p2 0.44 56
推薦図書 網羅的⼊⾨書 例数設計全般 57
推薦論⽂ まずはここから[1] FDAの推奨[2] [1] Althunian TA et al: Trials. 2017 Mar 7;18(1):107. doi: 10.1186/s13063-017-1859-x [2] Non-inferiority clinical trials to establish effectiveness (https://www.fda.gov/downloads/Drugs/Guidances/UCM202140.pdf) 58