4.5K Views
May 12, 23
スライド概要
スライド47は、GRADEアプローチでの最終的な見やすい表(ランキングの代わりになっている)
Benefits and harms of drug treatment for type 2 diabetes: systematic review and network meta-analysis of randomised controlled trials
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10077111/
Benefits and harms of drug treatment for type 2 diabetes: systematic review and network metaanalysis of randomised controlled trials https://www.ncbi.nlm.nih.gov/pmc /articles /PMC10077111/ ネットワークメタ分析の論文の図表の理解しよう第2弾 :2型糖尿病の薬物療法
緒言 2型糖尿病に対して、集中的な血糖コントロールによる大幅なリスク低減 の失敗を踏まえ、グルコース中心のパラダイムからますます脱却していま す。SGLT-2阻害薬とGLP-1受容体作動薬という2種類の薬剤は、特に心血 管疾患や腎臓疾患が確立している患者において、心血管と腎臓に利益をも たらします。 最近、2型糖尿病患者の治療薬として、非ステロイド性ミネラルコルチコ イド受容体拮抗薬であるfinerenoneと、グルコース依存性インスリントロ ピックポリペプチド(GIP)/GLP-1受容体作動薬であるtirzepatideという 新しい薬が利用可能になりました。 臨床医は現在、2型糖尿病患者に対して、SGLT-2阻害薬、GLP-1受容体作 動薬、あるいはファインレノンとチルゼパチドのいずれを、継続的な治療 レジメンに追加するかを指導する課題に直面している。 このネットワークメタ解析は、糖尿病治療薬に関するBMJ Rapid Recommendationの最新版に役立つだけでなく、医療技術評価、臨床実践 ガイドライン、その他の意思決定支援の更新において、専門学会や医療制 度に役立つように設計されました。
まず、方法の文章を読んでみよう 少し難しい所は、そのままで、読み進めてください
選択基準 対象となるRCTは、成人の2型糖尿病の治療に使用される薬剤を比較した ものである。 以下の薬物クラスを検討した: SGLT-2阻害薬、GLP-1受容体作動薬、 DPP-4阻害薬、チアゾリジン系薬剤、スルホニル尿素、メトホルミン、αグルコシダーゼ阻害薬、メグリチノイド、インスリン、GLP-1受容体作動 薬、非ステロイド性ミネラル・コルチコイド受容体拮抗薬。 付録1.3では、詳細な薬剤名と対照群(通常、試験実施時の標準治療で、 臨床医が新薬の追加を検討する前に患者が受けた治療レジメンを表す) (typically standard treatment at the time the trials were conducted, representing the treatment regimens the patient received before the clinician considered adding a new drug).の定義が記載されている。 対象となる試験は、追跡期間が24週間以上であった。複数の薬物治療クラ スの組み合わせと薬物治療なしを系統的に比較した試験、RCTのサブグ ループ分析、非英語の研究は不適格と判断した。
付録1.3:Standard treatments 標準治療には、標準治療(すなわち、生活習慣の改善)およ び無作為化試験の対象薬剤以外の標準薬剤治療 (e.g., metformin(メトホルミン) and/or sulfonylureas(SU 剤)) が含まれます。 ということは、メトホルミンと標準治療の比較では、直接比 較のRCTなら良いが、間接比較の場合、標準治療の中にメト ホルミンの治療が含まれている可能性がある。
検索方法と情報源・研究の選択 2022年10月14日までにOvid Medline、Embase、Cochrane Centralで過去に発表されたネットワークメタ解析から包括的 な文献検索戦略を用いた。検索では、非ステロイド性ミネラ ルコルチコイド受容体拮抗薬とデュアルGIP/GLP-1受容体ア ゴニストの用語を追加した。検索には、対象薬剤に関連する 心血管および腎臓のアウトカムを評価する他の同定されたシ ステマティックレビューの参考文献リストも含まれた。 本研究では、スクリーニング前に研究選択プロセスのパイ ロットテストを実施した。ペアの査読者(QS、KNo、QF、 ZQ、FY)が、タイトルと抄録、全文レベルで特定されたヒッ ト作を独立してスクリーニングし、不一致は上級査読者 (SL)が解決しました。
データ収集とデータ項目 標準化された抽出フォームを用い、訓練を受けたペア査読者(QS、 KNo、YM、QF、ZQ、XZ、XC、ZC、XL、SH)が独立して、以下 のデータを抽出した: 研究特性(年、国、設定、資金、フォローアップ期間); 試験参加者のベースライン特性(個人特性、参加者数、年齢、性別、 肥満度、ヘモグロビンA1c(HbA1c)、糖尿病発症期間、心血管疾 患、慢性腎臓病、肥満などの合併症); 介入方法(薬剤名、投与量、頻度、併用療法); アウトカム(試験特有の定義、二値アウトカムのイベント数と参加 者数、QOLスコア変化、体重変化)。 上級査読者(SL)が矛盾を解決した。プロトコール通りの結果より も、試験で報告された intention-to-treat 結果または修正 intention-to-treat 結果が優先された。
Risk-of-bias assessment 査読者のペアが独立してバイアスリスクを評価した(QS、KNo、LG、YJ、YM、AAs、 CZ、JPL、KNu、SRC、SG、YG、HZ、QiuY、XL、QinY、およびXA)。 McMaster UniversityのCLARITYグループによって修正されたCochrane risk-of-bias toolは、次の6つの領域(ランダム配列の生成、割付隠蔽、割付された介入への盲検化、 結果データの欠落、選択的結果報告、その他の懸念)についてリスクオブバイアス評価 17を知らせた。 17. Guyatt G, Busse J. Methods Commentary: Risk of Bias in Randomized Trials 1. DistillerSR. 2011. https://www.distillersr.com/resources/methodologicalresources/risk-of-bias-commentary ⇒コクランのRoB2.0の前に公開されたもので、これをコクランの2.0もこれを参考にし ているのですけどね~。 各項目の回答オプションは、間違いなくイエス(バイアスのリスクが低い)、おそらく イエス、おそらくノー、ノー(バイアスのリスクが高い)であった。 第3のチーム(KNo、QinY、QS)は、評価のペアをクロスチェックし、最終結果をまと め、残留する不一致を上級査読者(SL)が解決した。
アウトカムと効果測定 all cause death, cardiovascular death, non-fatal stroke, end stage kidney disease, and amputation; and the following outcomes as important: non-fatal myocardial infarction, admission to hospital for heart failure, body weight change, health related quality of life, severe hypoglycaemia, severe gastrointestinal events, genital infection, ketoacidosis due to diabetes, and hyperkalaemia leading to admission to hospital 全死亡、心血管死、非致死的脳卒中、末期腎臓病、切断を重 要、非致死的心筋梗塞、心不全による入院、体重変化、健康 関連QOL、重症低血糖、重症胃腸イベント、性器感染、糖尿 病によるケトアシドーシス、入院に至る高カリウム血症を重 要と判断しました。 Odds比、標準平均差、平均差。
データ統合 我々は、重み付き最小二乗推定量とMoore-Penrose擬似逆行列を用いたFrequentistグラフ理論アプローチを用いてランダム効果ネット ワークメタ解析を行った19。 19. Rücker G. Network meta-analysis, electrical networks and graph theory. Res Synth Methods 2012;3:312-24. 10.1002/jrsm.1058⇒普通の頻度論のNMAの事 原則的に、我々は、証拠がそうでないことを示さない限り、相対効果は同じクラスの薬剤間で同様であるという仮定から始め、ネット ワークノードは、そのメカニズムに基づいてほとんどの場合薬剤クラスにグループ化されている。ただし、GLP-1受容体作動薬が体重変 化に与える影響に関する証拠が、この出発点の仮定が不正確であると示唆している唯一の例外です。この 分析では、少なくとも1つのゼロイベントを持つ試験のグループのすべてのセルに0.5を加えることで、ゼロイベントを考慮するために 連続性補正を使用しました21。 21. Bhaumik DK, Amatya A, Normand S-L, et al.. Meta-Analysis of Rare Binary Adverse Event Data. J Am Stat Assoc 2012;107:555-67. 10.1080/01621459.2012.664484. グローバルな異質性は、研究間の分散の一般化モーメント推定値によって評価され、CochranのQ統計量の設計ベース分解によって検定 されました。 ノード分割と逆算法によって、ネットワークから間接的な推定値を計算しました。各ネットワークループについて、直接的な推定値と 間接的な推定値の比率の臨床的および統計的な意義を考慮して、局所的な非整合性( local incoherence・直接比較と間接比較の不一 致)を判断しました。⇒ノード分割は、ネットワークメタ分析から、直接比較と間接比較に分ける方法で、Rのnetmetaなどに実装され ている。 比較調整したファネルプロットは、出版バイアスを反映する可能性がある大規模研究効果のグローバルな影響を評価しました。 各直接比較と結果の潜在的な効果修飾因子(すなわち、基準年齢、性別、BMI、HbA1c、心血管疾患の割合、糖尿病の期間)の分布比 較に基づいて、および各薬剤と結果に対する治療効果のメタ回帰に基づいて、intransitivity(非推移性)を判断しました。 ⇒Intransitivity(非推移性)は、関心のある比較(A対B)の効果の間接推定の基礎となる直接比較(A対C、B対Cなど)が、そもそも 類似していること。
感度分析sensitivity analyses 試験期間に調整されたベイズネットワークメタ分析、希少なイベントに対する Mantel-Haenszel固定効果ネットワークメタ分析、バイアスのリスクが高い試験を 除外したメタ分析、末期腎臓病については長期透析、腎移植、腎不全による死亡の 複合を定義したメタ分析、第2相または第3相の試験を除外したメタ分析、および追 跡期間が2年以上の試験に関するハザード比を報告した研究をまとめたメタ分析を 含む感度分析を実施しました。
メタ回帰分析について:論文とは関係ないので飛ばして メタ分析は、平均的な効果量を計算するが、サブグループ解析をする事で、研究間の異質性(Heterogeneity・非一貫性・ Inconsistency)を評価しうるツールとなる。研究間の異質性はなければ良いか、ある場合も、それなりに多いと思われる。 また、異質性がある場合、ぱっと見ただけで、その理由がわかれば良いが、わからない事、また、わかっても統計学的に明示 したい場合があると思う。その場合に、サブグループ解析を使うと良いと事だ。 視点を変えると、サブグループ解析では、異質性を単に厄介なものとしてではなく、科学的仮説によって説明できるか否かと いう興味深い変動としてとらえる。最良の場合、これは私たちを取り巻く世界の理解を深めるものとなる。そうでなくとも、 少なくとも将来の意思決定の指針となる実用的な洞察を生み出すものとなる。 サブグループ解析というか、異質性を検討する一つの方法として、メタ回帰分析がある。メタアナリシスにおいて1次研究間 の異質性が存在すると考えられる時には、変量効果モデルをあてはめて効果サイズの「統合推計値」を計算することが可能で ある。しかしながら1次研究間の異質性が存在するということは、そもそも個々の研究ごとに異なる複数の「真の値」が存在 することを仮定することと同義であり、この想定下において「統合推計値」そのものは意味をなさない。 では何のためにこの「統合推計値」を計算するのか、という疑問がわくが、それは1次研究間の結果の差異を生み出す要因を 特定し、各要因が結果に対して持つ効果量を測定するためである。すなわち、この「統合推計値」を目的変数とし、1次研究 間の「真の値」の差異を生み出していると考える要因を説明変数として回帰分析を行うことで、各説明変数の有意性の検定と 効果量の算出が可能となる。この回帰分析を「メタ回帰分析」と呼ぶ。 サブグループとして異質性の要因(予測因子・説明変数)を、サブグループ1,2として、メタ回帰分析で表すと以下になる。 統合推定値=β0+β1(異質性の要因)+ϵk+ ζk ϵk(イプシロン k と読む)、 ζk(ゼータ k と読む)、βが固定効果、ζがランダム効果であり、その両方を含むので、混合効 果モデルと呼ばれることも多い(ϵは、サンプル誤差)。 しかし、一般的に回帰分析と言えば、予測因子が、連続変数が多い(いわゆる、線形の1次の場合、相関係数のための散布図 に引かれる真ん中の線のような感じ)(と教科書にあるが、ロジスティック回帰モデルなら、連続変数だとオッズ比がだせな いので、ダミー変数として連続変数としないことが多い)。 また、予測変数を複数にして、多重メタ回帰分析とすると、交互作用を検討できるが、さらに、ややこしい。
メタ回帰分析について:論文とは関係ないので飛ばして 前述したように、メタ回帰分析は、特定の研究特性がネットワークで発見された効果量の大きさに影響を与 えるかどうかを判断することが可能である。また、非一貫性を説明する可能性のある変数をチェックするの に便利なツールである。 たとえば、研究のバイアスのリスクが、ネットワークメタ分析における効果に影響を与えるかどうかを評価 したいとする。一般的に、バイアスのリスクの高い研究は、対照群または代替治療と比較して、より高い効 果を報告していることが考えられる。モデルに予測因子としてバイアスのリスクを含めることで、そのよう な関連をコントロールし、結果への影響を評価することが可能である。 ダミーコードの予測変数として、0 は低バイアスリスク、1 は高バイアスリスクを示すよにすると、低と高 で、サブグループ分析が可能となる。それだけなら、別にメタ回帰分析でなくても良い場合もあるが、メタ 回帰分析を使うと、サブグループ分析を行ったモデルが、「通常の」ネットワークメタ分析モデルよりも データにフィットしているかどうかを調べることもが可能である。これを行うには、逸脱度情報量規準 (Deviance Information Criteria, DIC) を比較する。これは、頻度論統計学における AIC および BIC 値に 相当する。 さて、ここから少し話が変り、 単群デザインにおける測定値と効果量について説明する。効果量が割合の 場合、その範囲が 0 と 1 の間に制限されていることが問題になることがある。0 または 1 に近いと、標準 誤差が人為的に圧縮され、割合の推定値の精度が過大評価されることになる。これを避けるために、割合を プールする前に logit 変換するのが一般的である。logit 変換では、まずオッズを計算する。オッズは、特定 のカテゴリーに該当する参加者の割合を、そのカテゴリーに該当しない参加者の割合で割ったものとして定 義される。logit 変換された値を使用する場合、この関数はプールのために逆分散法を使用せず、一般化線 形混合効果モデル (generalized linear mixed-effects model, GLMM) を構築する。基本的には、この関数 はロジスティック回帰モデルをデータに当てはめ、真の効果量が研究間で異なるという事実を説明するため に、ランダム効果を含んでいる。
メタ回帰分析について :論文とは関係ないので飛ばして 少し話がずれるが、ランダム効果メタアナリシスのメタアナリシスは、結果測定値と対応する標準誤差の推定値に基づく要約 測定アプローチに従います。このアプローチは、おおよその正規研究内尤度を仮定し、標準誤差を既知のものとして扱います。 このアプローチには、推定される標準誤差を考慮しない、推定値と標準誤差の間の相関を考慮しない、事象がゼロの場合に (任意の)連続性補正を使用する、事象が少ない研究では正規近似が悪いなど、いくつかの潜在的な欠点があります。 これらの問題は、研究中のおおよその正規尤度を適切な正確な尤度に置き換えることで、解決できる。よって、一般化線形混 合モデルを使うことになるらしい。たとえば、オッズ比メタ分析の場合、変量効果ロジスティック回帰などを使う。 と言うことで、メタ回帰分析には、オッズ比⇒ロジスティック回帰、という事がでてくると、ぼんやりと理解できる。 Doing Meta-Analysis in R: A Hands-on Guide Dr.Clover‘s Computer Clinic https://bookdown.org/baba_yoshihiko/Doing_Meta_Analysis_in_R/subgroup.html https://clover.fcg.world/2016/03/20/2807/ その他:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4433771/ https://www.researchgate.net/publication/46182141_Random_effects_metaanalysis_of_event_outcome_in_the_framework_of_the_generalized_linear_mixed_model_with_applications_in_sparse_data
メタ回帰分析について :論文とは関係ないので飛ばして 少し話がずれるが、ランダム効果メタアナリシスのメタアナリシスは、結果測定値と対応する標準誤差の推定値に基づく要約 測定アプローチに従います。このアプローチは、おおよその正規研究内尤度を仮定し、標準誤差を既知のものとして扱います。 このアプローチには、推定される標準誤差を考慮しない、推定値と標準誤差の間の相関を考慮しない、事象がゼロの場合に (任意の)連続性補正を使用する、事象が少ない研究では正規近似が悪いなど、いくつかの潜在的な欠点があります。 これらの問題は、研究中のおおよその正規尤度を適切な正確な尤度に置き換えることで、解決できる。よって、一般化線形混 合モデルを使うことになるらしい。たとえば、オッズ比メタ分析の場合、変量効果ロジスティック回帰などを使う。 と言うことで、メタ回帰分析には、オッズ比⇒ロジスティック回帰、という事がでてくると、ぼんやりと理解できる。 Doing Meta-Analysis in R: A Hands-on Guide Dr.Clover‘s Computer Clinic https://bookdown.org/baba_yoshihiko/Doing_Meta_Analysis_in_R/subgroup.html https://clover.fcg.world/2016/03/20/2807/ その他:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4433771/ https://www.researchgate.net/publication/46182141_Random_effects_metaanalysis_of_event_outcome_in_the_framework_of_the_generalized_linear_mixed_model_with_applications_in_sparse_data
本論文における、メタ回帰分析の役割 どうも、この論文では、 • メタ回帰分析として、サブグループ解析で、集団間で相対効果が一定であるかを評価( we assumed the constancy of relative effects across populations. すなわち、たとえば「心血管疾患を有する患 者の割合が高い試験ほど、死亡および心血管と腎臓のアウトカムを減少させる相対効果が大きいと仮定 する」が、メタ回帰分析とICEMANの結果、信頼できるサブグループ効果が示されなかったので、大き くなく「一定」だったと結論されている。 • また、ランダムインターセプトロジスティック回帰というメタ回帰分析による1アームの解析で、 intransitivity(非推移性)を評価した(各直接比較の組み合わせごとに、平均値とSEを計算して、それ に差があるかどうかをみる)( inconsistency(非一貫性) は、メタ回帰分析を使うのではなく、 Cochran’s Qで評価)。
Meta-regression1 本文の方法の項目に:Meta-regressionの小項目として、連続変数として測定された試験および集計された患者特性について、以下の4 つのメタ回帰を実施したとある。すなわち、信頼できるサブグループ効果が示されなかった場合、集団間で相対効果が一定であると仮 定( we assumed the constancy of relative effects across populations. )するために、4つの仮定に基づいて検討した。結果は信 頼が示されなかったので、以下の4つの仮定は、「~ほど、~が大きいと仮定」でなく「一定」であった。 1. 心血管疾患を有する患者の割合(心血管疾患を有する患者の割合が高い試験ほど、死亡および心血管と腎臓のアウトカムを減少 させる相対効果が大きいと仮定する)。 2. ベースライン時の患者の推定糸球体濾過量の平均値(推定糸球体濾過量が低い患者ほど、死亡、心血管および腎臓のアウトカム を減少させる相対的効果が大きいと仮定する)。 3. ベースライン時の患者の平均体格指数(体格指数が高い患者ほど、死亡、心血管および腎臓の転帰を減少させる相対的効果が大 きいと仮定する)。 4. 試験のフォローアップ期間(フォローアップ期間が長い試験ほど、死亡、心血管および腎臓のアウトカムを減少させる相対的効 果が大きいと仮定する)。 明らかなサブグループ効果の信頼性(回帰係数の信頼区間は無効効果を除く)は、ICEMANツールを用いて評価した26。信頼できるサ ブグループ効果が示されなかった場合、集団間で相対効果が一定であると仮定した( we assumed the constancy of relative effects across populations. )。 26. Schandelmaier S, Briel M, Varadhan R, et al.. Development of the Instrument to assess the Credibility of Effect Modification Analyses (ICEMAN) in randomized controlled trials and meta-analyses. CMAJ 2020;192:E901-6. 10.1503/cmaj.200077⇒サブグループが適切かを見るチェックリスト 結果:Subgroup analyses and sensitivity analysesの小項目として、Our study did not identify any credible subgroup effects (appendix 7) and all sensitivity analyses confirmed the robustness of our findings (appendix 8). ) (本研究では、信頼できるサ ブグループ効果は確認されなかった) 付録Appendix 7 Meta-regression analyses:The study regressed the treatment effects of several outcomes on four subgroup factors—patients’ body mass index (BMI), proportion of patients with established cardiovascular disease at baseline, patients’ estimated glomerular filtration rate (eGFR), and trial’s follow-up (log scale). この研究では、複数のアウトカムの治療効 果を、患者の体重指数(BMI)、ベースライン時の心血管疾患の割合、患者の推定糸球体濾過率(eGFR)、試験のフォローアップ(対 数スケール)の4つのサブグループ要因に回帰させました。少なくとも10試験以上関与した解析に対して、係数Coefficienと予測効果 Predictive effectのみを示す。サブグループ因子を特定の値に設定した場合の治療効果を予測し、その傾向を説明した。そして、BMIで サブグループに分けた結果などが記載されている。
Meta-regression2 本文の方法のData synthesisの項目: global heterogeneity はCochran’s Q、local incoherenceは直接比較と間接比較の比から、publication biasは ファンネルプロットから評価。We judged the intransitivity based on distribution comparisons of potential effect modifiers ( ie, baseline age, sex, body mass index, HbA1c, the proportion of cardiovascular disease, and duration of diabetes) for each direct comparison and ou tcome, as well as meta-regressions of these parameters with the treatment effect for each drug and outcome.(私たちは、各直接比較とアウトカムについてのポテ ンシャルな効果修飾因子(例えば、ベースラインの年齢、性別、体重指数、HbA1c、心血管疾患の割合、糖尿病の期間)の分布比較に基づいて、 intransitivity(非推移性・間接推定値のエビデンスの確実性の因子として、それに関与する優勢一次ループの直接比較同士が、そもそも類似して いるか)を判断しました。各薬剤とアウトカムに影響する治療法に伴う、これらのパラメータをメタ回帰分析で評価した。) 確かに、直接比較間で、年齢とかの分布を図示すれば、直接比較同士が類似してないかどうかを判断できる。 本文の結果の項目:The evidence did not suggest global publication bias and intransitivity for any outcome (appendix 4.7), nor did the results suggest relevant global inconsistency or incoherence in outcomes except for health related quality of life, body weight change, and amputation (appendices 4.4, 4.5, and 4.6).(付録4.7 (*)によって、global publication bias and intransitivitがどのアウトカムでも示唆されず、付録4.4, 4.5(#), and 4.6によって、健康関連QOL、体重変化、切断amputation を除くアウトカムにおいて、lobal inconsistency(非一貫性) or incoherence (非整合性)を 示唆しなかった。 ) 4.7は、Publication bias assessmentsとある。4.4は、明らかに、HeterogeneityのためのCochran’s Qなどの表なので、 inconsistency のこと。4.6は、 Incoherence assessmentsのタイトルで、Incoherence(非整合性・直接比較と間接比較の不一致)を、その比または差に対応する統計検定で評価し たとある。そして、付録4.5はIntransitivity assessmentsとなっている。よって、本文の、付録4.5とある位置が、間違っており、(#)でなく(*)にあるべきと 推察される。確かに、 Appendix 5 GRADE certainty of evidence assessments のD5, intransitivity;の所は、すべて「0」であるが、D6, incoherenceの 所は、HRQoLなどで「-1」となっている。 付録4.5 Intransitivity assessments: The study assessed the intransitivity between direct comparisons by comparing their distribution of patients’ characteristics. We chose the potential effect modifiers from the prognostic variables identified by the prognostic research and the systematic review of risk prediction models. The illustrated figures show pooled mean or proportion and corresponding confidence interva l by the randomeffect single-arm meta-analyses via a random-intercept logistic regression. The duration of baseline diabetes was shown using median and interquartile due to skew distribution.本試験では、患者特性の分布を比較することで、直接比較の間のintransitivity(非推移性)を評価した。効果 修飾因子(年齢とか、BMIなどで、非推移性に関係しそうな因子)は、予後研究およびリスク予測モデルのシステマティックレビューによって選択した。 図には、ランダムインターセプトロジスティック回帰によるランダム効果単群メタアナリシスによるプールされた平均値または割合とそれに対応する 信頼区間が示されている。ベースラインの糖尿病期間は、分布が歪んでいるため、中央値および四分位数を用いて示した。そして、年齢やBMIなど の因子が、直接比較の治療法の組の違いで、徐々に変化するのを示す図となっている。本文の結果より、intransitivitはないとあるが、直接比較の 組み合わせで、95%CIが広くて、多くが重なっているようだが、重なってない治療の組み合わせがあることより、 intransitivitがあるのではないかと 思うが、有意差がなかったのか、 intransitivitはないと判断するようだ。
GRADE certainty of evidence assessment GRADEガイダンスに従い、直接比較のエビデンスは高い確実性のエビデンスとして開始し、バイアス、非一貫性、 非直接性、出版バイアスのリスクについて評価を下げることができた。 間接比較のエビデンスは、さらに、intransitivityでレーティングダウンすることができた。 貢献度マトリックスは、ランダムウォーク法を用いて、各直接比較と各間接比較およびネットワーク比較の比例的 な貢献度を定量化した。 ネットワークエビデンスの最終的な確実性は、incoherence or imprecisionでレーティングダウンした30。 30. Zeng L, Brignardello-Petersen R, Hultcrantz M, et al.. GRADE guidelines 32: GRADE offers guidance on choosing targets of GRADE certainty of evidence ratings. J Clin Epidemiol 2021;137:163 -75. 我々は、GRADEガイダンスに従って不精確さを評価した。95%信頼区間が2つ以上の重要度の閾値を越える場合は、 不精確さを2段階下げて評価した(付録1.4および5)31。 31. Zeng L, Brignardello-Petersen R, Hultcrantz M, et al.. GRADE Guidance 34: update on rating imprecision using a minimally contextualized approach. J Clin Epidemiol 2022;150:216 -24. 介入の相対的影響を分類するために、我々はヌル効果を決定閾値として、標準治療を参照介入として選んだ32 33。 まず、治療を標準治療と異なるか異ならないかに分類し、その後、標準治療との差が確立しているもののうち少な くとも1つと異なるか異ならないかに分類した。このプロセスにより、最良のものから最悪のものまで、5つのカテ ゴリーの治療法が確立された。 次に、標準治療と比較したエビデンスの確実性に応じて、これらの薬剤をエビデンスの確実性が高い・中程度と低 い・非常に低いものとして分けた。⇒これが、この図のこと
付録1.4 Details of GRADE approache 直接比較からのエビデンスは、バイアスの高いリスク(全てのドメインと研究全体で高いリスクの割合によって判断)、非一貫 性、非直接性、および局所的な出版バイアス(ペアワイズ出版バイアス)[Balshem et al, 2011]によって評価を下げました。 間接比較からのエビデンスは、intransitivityによってさらに評価を下げました。 ランダムウォーク法を用いた寄与度マトリックスによって、各直接比較が各間接比較およびネットワーク比較に対する割合的な 貢献を定量化し、間接比較およびネットワーク比較の確実性の開始点を決定しました[Davies et al, 2022]。 Davies AL, Papakonstantinou T, Nikolakopoulou A, et al. Network meta-analysis and random walks. Stat Med 2022;41:2091–114. doi:10.1002/sim.9346 ⇒ネットワーク推定値の直接比較の寄与する割合を色分けで図示した図である。付録5.2 Percentage contribution matrixの図 だが、本当に使ったか不思議だ。細かすぎ。結局、間接比較のループの数などで見ているのではと思うが、どうなんだろう。間 接比較については、優勢一次ループとして、どの直接比較のペアを2つ使っているかを決定したということのはずだ。 最終的なネットワークエビデンスの確実性は、 incoherence or imprecision [Puhan et al, 2014]があれば、それらを下げま した。 ⇒付録5.1 GRADE assessment tableのことを、左から順番に説明しているだけである。 D1, risk of bias; D2, indirectness; D3, heterogeneity (inconsistency); D4, publication bias; D5, intransitivity; D6, incoherence; D7, imprecision; k, no. of studies; NMA, network meta-analysis; Prop, proportion of contribution of direct estimates to network estimates
付録1.4 Details of GRADE approache 非一貫性:頻度主義のランダム効果ペアワイズメタ分析(普通の直接比較のメタ分析の事)によって推定された点推定値の 類似性と信頼区間(CI)の重複に基づいて、非一貫性を評価しました。 出版バイアス:5-9件の試験を含む比較では、Harbordのスコアテスト[Harbord et al, 2006](バイナリアウトカム)また はEggerのテスト[Egger et al, 1997](連続アウトカム)によって、0.05の有意水準で局所的な出版バイアスを検出した場 合、それを評価しました。10件以上の試験を含む比較では、バイナリアウトカムに対してはHarbordのテスト、連続アウト カムに対してはEggerのテストを使用して、出版バイアスを評価しました。上記の統計分析によって出版バイアスが有意であ ると示された比較では、trim and fill分析が出版バイアスが結果の方向を変えたことを示唆した場合、エビデンスの確実性を 下げました[Duval and Tweedie, 2000]。 不精確さと閾値について:null effect decision threshold [Zeng et al, 2021]を用いたGRADEアプローチを用いて不精確さ を評価しました。前のガイドラインパネルによって確立された最小重要差(MID)よりも点推定値が小さい場合、小さな効 果または無効を確信度として評価しました。カーディオバスキュラーおよび腎臓アウトカムでは、前のガイドラインパネル (高リスクグループの基準リスクを採用)のベースラインリスクを相対効果に適用して、絶対効果を計算しました。他のア ウトカムでは、少なくとも1年の追跡期間を持つコントロールアーム(つまり、標準治療)の単一率ランダム効果メタ分析を 使用して、絶対効果を計算しました。95%CIが1つ以上の重要性の閾値を交差した場合、不精確さを2つのレベルで評価を下 げました[Zeng et al, 2022]。 本研究では、バイナリアウトカムのMIDは以前のガイドライン[Li et al, 2021]から採用し、体重変化のMIDは5 kgの変化、 生活の質のスコアのMIDは総スコアの10%としました。標準化平均差は[SF-36]に特定の質問紙を使用した場合に、ガイド [Murad et al, 2019]に従って平均差に変換しました。したがって、生活の質のスコアのMIDは、標準偏差と同じになります。
絶対的な効果の推定 臨床的な意思決定をより適切に行うために、すべての薬剤が心血管、腎臓、および安全性のアウト カムに及ぼす予想される絶対効果を推定した。 有効な場合は、リスク予測モデルのシステマティックレビューを含む臨床実践ガイドラインで適用 されたベースラインリスク推定値を採用した34。 心血管および腎臓のアウトカムのリスクが異なる成人2型糖尿病患者を対象に、心血管リスク因子が 3つ以下、心血管リスク因子が3つ以上、心血管疾患が確立しているが慢性腎臓疾患がない、慢性腎 臓疾患が確立しているが心血管疾患がない、心血管疾患と慢性腎臓疾患が確立しているという5段階 の基準リスクに対して相対効果を適用して絶対利益(5年間で1000患者当たりのイベント数)を算 出した。 ガイドラインに含まれないアウトカムについては、ランダム効果単群メタ解析(付録5.3)を用いて、 対照群の発生率を試験間でプールすることによりベースラインリスクを予測し、個々のリスクプロ ファイル(例:性器感染症のリスク)でさらに層別化しないようにしました。 このネットワークメタアナリシスから9770の効果推定値を提示することの複雑さを考慮し、我々は 主に相対的および絶対的効果推定値、確実性、およびより詳細なネットワークメタアナリシス結果 (例えば、各比較の参加者と試験数)を、対話型のGRADE要約表、MATCH-ITツール ( https://matchit.magicevidence.org/230125dist-diabetes)で提示することにした。また、 このツールでは、エンドユーザーが比較対象の変更(例:主要な心血管および腎臓のアウトカムに ついて、ファインレノン対SGLT-2阻害剤またはGLP-1受容体作動薬)を含む治療オプションの比較 を行うことができます。⇒標準治療以外の組み合わせの結果を、見ることができると言うこと。 もっとも、付録のリーグテーブル・Appendix 6 Anticipated absolute effectsなどにあるが、どこ をみて良いかわかりにくいので、Webツールを使ったということだ。
絶対的な効果の推定:オッズ比より計算 たぶん、以下の計算式と思われる。代入すると結果もあう。 Absolute Risk Difference: ((ORpredictor * Baseline risk)/ ((1-Baseline risk) + (ORpredictor * Baseline risk))) - Baseline risk OR is 0.81and the baseline risk is 0.022; so the risk of treatment is = ((0.81* 0.022)/ ((1- 0.022) +(0.81* 0.022))) = 0.018 Absolute risk change = 0.018 – 0.022 = -4 = 4 fewer
患者・市民参加 患者・市民参加アウトカムの選択と重要度評価、各アウトカムの最小重要差につい ては、本システマティックレビューでは、患者パートナーから価値観や好みを伝え られた過去のガイドラインとその会社のシステマティックレビューを参照しました。
SRの流れに従って、図表を確認していこう
1.1 Search strategy・Fig1(検索式・論文選択)
1.2 Definition of outcomes(たぶん、検索式の前に行なうが、後に記載)
1.3 Summary of included interventions (検索した論文より、含まれていた治療法を、分類した)
Table 1 Baseline characteristics of included trials and participants 表1として、含めた研究の全体のサマリーを書くのが一般的なので、書かれている が、これほど多い研究を、一つにまとめた数字は、本当に役立つのか疑問だな。
1.4 Details of GRADE approaches(GRADEアプローチによるエビデンスの 確実性の詳細な手順) k 研究数、 D1 リスクオブバイアス、D2 非直接性、D3 非一貫性heterogeneity (inconsistency)、D4 出版バイアス、 D5 非推移性intransitivity、Prop ネットワーク推定値に対する直接推定値の寄与率、D6 非整合性incoherence、 D7不精確さ ←ここの項目が、いろいろな付録の表で評価されている。
Appendix 2 List of included studie(採用論文のサマリーなどリスト(k 研 究数・D2 非直接性))
Appendix 3 Risk of bias assessments(D1 リスクオブバイアス)
4.1 Network plots for the outcomes ( Initial Indirect Certaintyをどの組 み合わせから評価するかを決める) 評価方法:研究数・患者数が多 いものを優性一次ループとする 上手は、本文のアウトカム全部だが、アウトカムごとが、付録4.1にある。 これを見ると、Standard treatmentsとNon-steroidal MRAsの直接比較は、あるが、下図が少ない。 Non-steroidal MRAsと、SGL-2 inhibitorsの直接比較がないことなどがわかる。
4.4 Heterogeneity (Inconsistency) assessments (D3 非一貫性heterogeneity (inconsistency)) 評価方法:コクランのQ検定など
4.5 Intransitivity assessments(D5 非推移性intransitivity) 評価方法:各直接比較のBMIなどを単アームロジスティック回帰モデルで図示
4.6 Incoherence assessments(D6 非整合性incoherence) 評価方法:直接推定と間接推定との差、およびその比や差に対応する統計的検定
4.7 Publication bias assessments(D4 評価方法:y Harbord’s test or Egger’s test・funnel plot. 出版バイアス)
4.8 Between-study variance(研究間分散) なぜ、わざわざ書いてあるのか不明だが、一応、研究間の非一貫性のチェックなどになる。 参考:Methods to estimate the between-study variance and its uncertainty in metaanalysis https://onlinelibrary.wiley.com/doi/10.1002/jrsm.1164
5.2 Percentage contribution matrix( Prop ネットワーク推定値に対する 直接推定値の寄与率)
5.1 GRADE assessment table これまでのいろいろな評価を、ここでまとめて、一番右の、NMA Certaintyを判定する。 k 研究数、 D1 リスクオブバイアス、D2 非直接性、D3 非一貫性heterogeneity (inconsistency)、D4 出版バイアス、 D5 非推移性intransitivity、Prop ネットワーク推定値に対する直接推定値の寄与率、D6 非整合性incoherence、 D7不精確さ
4.3 League tables 5.1 GRADE assessment tableから、エビデンスの確実性を、NMA推定値 の総当たり一覧のリーグテーブルで色分けして、提示する。こちらの表の が、先出だが、5.1を行なわないと色分けできないため、順番が逆転。
4.2 Forest plots 標準治療を参照比較として、治療ごとで並べたタイプのフォレストプロット。
5.3 Baseline risk estimation 本試験では、1年以上かつ6000人月以上(すなわち5年あたり100人)の追跡調査を行った試験にお いて、標準治療群による重症低血糖、重症消化器イベント、切断、糖尿病によるケトアシドーシス、 入院に至る高カラ血症のベースラインリスクを推定した。解析では、単群ランダム効果メタ解析を 用いて、対照群の発生率をプールした。 その他のアウトカムのベースラインリスクは、前回のガイ ドライン[Li et al, 2021]のものを採用した。
Appendix 6 Anticipated absolute effects 本研究では、成人2型糖尿病患者であり、1)心血管危険因子が3つ以下、2)心血管危険因子が3つ以上、3)心血 管疾患が確立しているが慢性腎臓病ではない、4)慢性腎臓病が確立しているが心血管疾患ではない、5)心血管疾 患と慢性腎臓病が確立した、という5段階のベースラインリスクに相対効果を適用し絶対効果を予想した。ベース ラインリスクは以前のガイドラインのものを採用した(詳細は付録1.4参照)。オンラインツールにより、絶対効果 の迅速な照会が容易となった(https://qingys.shinyapps.io/data_visualization)。
NMA推定値とエビデンスの確実性と絶対リスク差の繰り返し表示について 5.1 GRADE assessment table 4.3 League tables 6.1 In patients with 3 or fewer cardiovascular risk factors 6.2 In patients with more than 3 cardiovascular risk factors
繰り返し表示について:標準治療との比較 4.2 Forest plots 6.4 In patients with chronic kidney disease Fig 3 Fig 4 8.2 Results of Frequentist sensitivity meta-analyses
Fig 3 Benefits and harms of drug treatments for type 2 diabetes. ここまでのいろいろな評価 をまとめる。 NMA推定値・エビデンスの 確実性・効果の大きさより、 色分けされている。
Fig 4 Anticipated absolute effects for patients with type 2 diabetes and chronic kidney disease, by drug treatment. 2型糖尿病および慢性腎臓 病の患者さんに対する薬物 治療別の予想される絶対効 果のため、総当たりの付録 6.4 In patients with chronic kidney diseaseを、 標準治療を参照治療として 取り出し、見やすくしたも の。
Fig 5 Body weight impact of drug treatment for type 2 diabetes by drug treatment. 2型糖尿病の薬物治療による体重への影 響(薬物治療別)。 MDのままなので、5.1 GRADE assessment tableから推定値と確実性 を取り出している。
Appendix 7 Meta-regression analyses 信頼できるサブグループ効果が示されなかった場合、集団間で相対効果が一定であると仮定( we assumed the constancy of relative effects across populations. )するために、4つの仮定に基づいて検討した。結果は、メタ 回帰分析と、 ICEMANというサブグループ解析のためのチェックリストより、信頼できるサブグループ効果が示さ れなかったので、以下の4つの仮定は、「~ほど、~が大きいと仮定」したが、「一定」であった。 1. 心血管疾患を有する患者の割合(心血管疾患を有する患者の割合が高い試験ほど、死亡および心血管と腎臓 のアウトカムを減少させる相対効果が大きいと仮定する)。 2. ベースライン時の患者の推定糸球体濾過量の平均値(推定糸球体濾過量が低い患者ほど、死亡、心血管およ び腎臓のアウトカムを減少させる相対的効果が大きいと仮定する)。 3. ベースライン時の患者の平均体格指数(体格指数が高い患者ほど、死亡、心血管および腎臓の転帰を減少さ せる相対的効果が大きいと仮定する)。 4. 試験のフォローアップ期間(フォローアップ期間が長い試験ほど、死亡、心血管および腎臓のアウトカムを 減少させる相対的効果が大きいと仮定する)。
Appendix 8 Sensitivity analyses 付録に記載がある文章は、難しいので、本文の文章を再度掲載します。 試験期間に調整されたベイズネットワークメタ分析、希少なイベントに対する Mantel-Haenszel固定効果ネットワークメタ分析、バイアスのリスクが高い試験を 除外したメタ分析、末期腎臓病については長期透析、腎移植、腎不全による死亡の 複合を定義したメタ分析、第2相または第3相の試験を除外したメタ分析、および追 跡期間が2年以上の試験に関するハザード比を報告した研究をまとめたメタ分析を 含む感度分析を実施しました。
結局、どの表をみるのか?
ほぼほぼ、Fig4とFig2をみて、DMに対するこれまでの知識・臨床の経験から考える 付録の、多量の資料は、ほぼほ ぼ、このFig4を作成するため に必要となる資料である。 エビデンスの確実性が2段階で、 標準治療との比較のみなので、 確実性が4段階とか、総当たり を見たいならば、付録4.3 League tablesだし、エビデン スの確実性の詳細を知りたいな ら、5.1 GRADE assessment tableを見ることになる。
実際の、EBMに詳しい先生の実践的な解説を知りたいなら にゃんごう&いがさんのEBMerな夜 で解説が聞けます ポッドキャストエピソード にゃんごう&いがさんのEBMerな夜 第76回放送:2型糖尿病治療薬と食事プログラムの効果 2023/4/16 37分 57秒 https://open.spotify.com/episode/1r3EaDK6p6xoqaKUiLqN1R?fbclid=IwAR 0Skc407jAum-9qdaI3H6MflgmxnRnRhEP__3FxrhkgJ0ql60jqqMqDaDE