NMAの一般的な問題点の説明と総当たり数

3.6K Views

May 05, 23

スライド概要

Is Network Meta-analysis a Revolutionary Statistical Tool for Improving the Reliability of Clinical Trial Results? A Brief Overview and Emerging Issues Arising
https://iv.iiarjournals.org/content/37/3/972.long

A simple formula for enumerating comparisons in trials and network meta-analysis
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6402080/

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

Is Network Meta-analysis a Revolutionary Statistical Tool for Improving the Reliability of Clinical Trial Results? A Brief Overview and Emerging Issues Arising https://iv.iiarjournals.org/content/37/3/972.long A simple formula for enumerating comparisons in trials and network meta-analysis https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6402080/

2.

Is Network Meta-analysis a Revolutionary Statistical Tool for Improving the Reliability of Clinical Trial Results? A Brief Overview and Emerging Issues Arising GEORGE BEIS and IOANNIS PAPASOTIRIOU https://iv.iiarjournals.org/content/37/3/972.long

3.

本総論の趣旨:NMAの有用性について メタアナリシスは、高く評価されている。 メタアナリシスの主な目的は、複数の研究によって評価されながら 一貫性のない結果が得られている場合に、どの治療が最も効果的か という臨床研究の基本的な疑問に対して明確な答えを提供すること。 ペアワイズメタ解析は、2つの特定の介入の相対的効果にのみ言及 するだけのため、特に重要な治療法間の比較が欠落している場合は、 NMAによって間接のエビデンスが必要となる。 臨床医に対して、より全体像を示し、それによって要約結果を用い てより明確に治療を「ランク付け」できるようになる。 ランク付け:複合(混合)効果量をこれらの直接および間接成分の 加重平均として評価することで達成され、これにより、たとえ単一 の試験で比較されていなくても、競合する介入をその相対的有効性 に応じてより明確に順序付ける。

4.

本総論の趣旨:レビューの目的 頻度主義モデルとベイズモデルの両方を用いたモデルが利用可能になって いる。 医薬品の承認プロセスにおけるNMAモデルの研究は、競争力のある図と対 応するエビデンスの両方について正確な情報を提供することにより、臨床 試験の設計に決定的な貢献をすることができ、収集した情報は、臨床試験 の設計が強力な支持を受けることができる最善のものであることを確認す るのに役立ちます。 しかし、結果が偏ったり膨らんだりしないように、それを特徴づける概念 の解釈において適切な注意が払われることが前提である(24)。 Fanelli D, Costas R and Ioannidis JP: Meta-assessment of bias in science. Proc Natl Acad Sci U S A 114(14): 3714-3719, 2017. PMID: 28320937. DOI: 10.1073/pnas.1618569114 https://www.pnas.org /doi/10.1073/pnas.1618569114 このレビューの目的は、そのリスクとメリットに焦点を当て、関連する新 たな問題や懸念を概説し、その基礎となる主要な概念を検討することであ る。

5.

ネットワークジオメトリ・Network Geometry(幾何学) 臨床試験では、NMAでn個の治療に対して、デザインの最大数(す なわち試験内の各治療の組み合わせ)は 2n-n-1である。 各マルチアーム試験では、臨床試験やペアワイズメタ解析で観察さ れない場合でも、すべての可能な固有の比較を含む(n¦2)=n(n-1)/2の 比較があり、完全に連結したネットワークとなるであろう。 しかし、組み合わせ式で予測される比較の中には、プロトコルの遵 守やポストホックの制限により不適格となるものもある(26)。 Shokraneh F and Adams CE: A simple formula for enumerating comparisons in trials and network meta-analysis. F1000Res 8: 38, 2019. PMID: 30863537. DOI: 10.12688/f1000research.17352.2 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6402080/ ネットワーク図は、各治療にどれだけの選択肢があるか、ある種の 比較が回避されているかどうか、比較対象者の可能な選択肢の中に 特定のパターンがあるかどうかを理解するために、重要である。

6.

NMAの前提条件 NMAの主な目的は、3つ以上の介入・治療を直接的・間接的なエビデンスを用いて評価・分析する ことで、各治療の効果を検証し、統計的に検証することである。 したがって、NMAが有効であるためには、直接証拠の推移性、非一貫性(整合性)、均質性 (transitivity, consistency, and homogeneity)といった基本的な前提が満たされていなければな らない。 より具体的には、これらの仮定を統計的検定で評価する必要がある(34)。しかし、これらの方法 論は、あまり理解されていないものの、ネットワークメタ解析を理解する上で重要な概念である (35、36)。このため、これらの仮定を支配する基本原則を説明する。 Ahn E and Kang H: Concepts and emerging issues of network meta-analysis. Korean J Anesthesiol 74(5): 371-382, 2021. PMID: 34551467. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8497908/ Catalá-López F, Tobías A, Cameron C, Moher D and Hutton B: Network meta-analysis for comparing treatment effects of multiple interventions: an introduction. Rheumatol Int 34(11): 1489-1496, 2014. PMID: 24691560. Efthimiou O, Debray TP, van Valkenhoef G, Trelle S, Panayidou K, Moons KG, Reitsma JB, Shang A, Salanti G and GetReal Methods Review Group: GetReal in network meta-analysis: a review of the methodology. Res Synth Methods 7(3): 236-263, 2016. PMID: 26754852.

7.

NMAにおける推移性、非一貫性(整合性)、異質性の概念について The Concepts of Transitivity, Consistency, and Heterogeneity in NMA 推移性:有効な間接比較(ABなど)は、ACとBCの両研究がこれらの特性の分布の点で類似していることを必要と し、その場合にのみ、transitivityの仮定が適用される。 Transitivityは本質的に計算不可能な仮説であるが、それでもその妥当性は臨床や疫学的手法で評価することができ (、適切な修正を加えることでその仮説の妥当性を確保することができるモデルが発見されている。 しかし、臨床特性が異なる場合(患者集団が異なるなど)には、transitivityの仮定に反するため、間接AB比較の推 定値は無効となる。さらに、臨床試験で発表された十分な詳細が必ずしも詳細な評価を可能にしないため、 transitivityの不在を検出することはしばしば困難である。

8.

Incoherence 非一貫性(整合性) 統計用語に翻訳されたtransitivityは、本質的にconsistency (or coherence)一貫性(または首尾一貫性)となる。 NMAにおける最大の課題の一つである領域は、一般的に直接証拠と間接証 拠が乖離しているときに発生する矛盾。 用語が混乱しやすい: transitivityを統計学用語とすると、consistencyとなる?という、一般的な 用語と統計用語で、若干定義が異なるという事で注意が必要。 直接比較と間接比較の不一致を示すが、同じループでの不一致だけでなく、ABCの結果(A>>C、 B>C)なら、A>Bでないと整合性がとれないという意味でも、Incoherenceの用語を使うことがあ る。 ややこしいことに、「If estimates from direct and indirect evidence disagree, transitivity does not hold and there is incoherence within the network. (直接証拠と間接証拠からの推定 値が一致しない場合、transitivityは成立せず、ネットワーク内にincoherenceが存在することにな ります。)」などという文章もある。直接比較と間接比較の不一致でも、transitivityは同じ(A対C、 B対Cの背景が同じ)でも良いはずだ。 個人的には、これが、非常に深刻ならば、そもそも、ネットワークメタ分析が成り立ってない気が する。 指標:いろいろな指標があるが、どれも利欠点がある。Bucherアプローチ、CochranのQ統計、 ノード分割、および矛盾パラメーターアプローチ、ネットヒートアプローチ。

9.

Incoherence 非一貫性(整合性)の測定方法 NMAにおけるIncoherenceの大きさは、あらかじめ決められたループで直接効 果と間接効果の総和を比較することで統計的に算出したり、矛盾を許容するモ デルと許容しないモデルを当てはめることでネットワーク化したりできる。 測定する方法はいくつかある。 方法論のいろいろ:The magnitude of inconsistency in an NMA can be statistically calculated by comparing direct and indirect summative effects in predetermined loops (15, 49) or a network by fitting models that allow and disallow inconsistency (50, 51). There are several methods for measuring inconsistency when suspected (48), such as the Akaike (52) and Deviance (53) information criteria for assessing the goodness of fit of models in frequentist/Bayesian approaches to NMA or meta-regression models (50). Also, several methods for detecting inconsistency in an RCT network include the inconsistency parameter approach (48) and the net heat graphical approach (54, 55). ‘Node splitting’ model methods (56-58) have been reported too in the literature to assess inconsistency in NMA, with any direct comparison excluded from the network and then calculating the difference between these direct and indirect components from the network, while appropriate decision rules have been defined to select only those comparisons belonging to potentially inconsistent loops in the network (57). As mentioned earlier, inconsistency exists when discrepancies between direct and indirect estimates exist, therefore transitivity is a common cause of inconsistency.

10.

homogeneity or heterogeneity NMAのもう一つの非常に重要な利点は、それが関わる一対比較のそれぞれ において、異なる臨床試験の結果の間に同質性があるか異質性があるかを 調査できること 一対比較のそれぞれにおける異なる臨床試験の結果の異質性の評価は重要 で、考慮されるべきである。 方法論のいろいろ:. There are many valuable reviews on assessing and dealing with heterogeneity (59, 60) in a network. Heterogeneity in a meta-analysis is usually assessed with Cochran’s Q statistic (61-64) and in particular with Cochran’s generalized Q statistic for multivariate meta-analyses, where it can be used in the context of NMA to quantify heterogeneity across the network, both within trials and between trials (the latter is known as inconsistency). Although heterogeneity variance is often the most difficult parameter to estimate, several alternative approaches to estimating this variance have been explored in NMA studies (65) in recent years such as the use of the I2 statistic (62, 66-68) (proportion description between-study variation) or meta-regression models (69, 70) are mainly used to reduce heterogeneity (and inconsistency) between RCTs in the network. Measures have also been considered to assess its confidence in the results of an NMA, where the impact of its variability on the corresponding clinical decisions is analyzed (71). In the special case when variances in between-study heterogeneity are estimated with considerable imprecision (because the data are sparse), including external evidence usually improves the conclusions (72). However, as the power and precision of indirect comparisons included in the NMA study depend on sample size and extensive statistical information, further improvements in methodology should be made.

11.

NMAにおけるトリートメントのランキング 研究結果は不確実性と密接に関連しており、その結果、その治療法 が最も効果的であると確信することはできない。 しかし、どの治療法が最も優れているかについて、特定の結果が出 る確率を求めることはできます。 各治療法についてベイズ的な考え方を用いると、可能性のあるすべ ての治療法の事後分布から、特定のランクを持つ確率が導き出され る。そして、総合的な順位を定量化し、各治療に関連する固有の数 値を示す累積順位曲線SUCRA下の面積によって、治療がランク付け される(SUCRAの値が高く、100%に近いほど、ある治療が1位に 近い確率が高く、この値が0に近い場合はその逆である)。 NMAで治療を比較するために、Pスコアと呼ばれるSUCRAの頻出類 似値(頻出主義の視点を考慮して)も使用される。どちらの概念も、 0~1の連続尺度で治療法をランク付けすることができ、ランコグラ ムはこれらの値をグラフで表す。

12.

ベイズ統計推論 ベイズ統計では、欠損データの取り扱いなど frequency テク ニックでは対応できない問題を扱うことができ、より柔軟で ある。 さらに、より小さな信頼区間でより正確な効果推定値を与え るため、より頑健であると考えられ、したがって、頻度統計 解析の競合手法としてではなく、より有意な結果の成功に寄 与する追加ツールとして考えるべきであると示唆されている。

13.

ベイズ統計のメソドロジーについて、少し説明 ベイズメタ解析は主に階層ベイズモデルに基づいており、こ のモデルの基本原理は通常のランダム効果モデルと非常に似 ている。 ベイズメタ分析モデルを当てはめる場合、収束のための十分 な反復が含まれているかどうかモデルをテストすることが重 要であり、また、シミュレーション結果全体への影響を評価 するために異なる事前基準で感度分析を実行することも重要 である。 ベイズ確率モデルで使用されるマルコフ連鎖モンテカルロ (MCMC)アルゴリズムは、(収束により)最適解を発見し ていなければならず、そうでなければ、さらに反復を繰り返 す必要がある。MCMCシミュレーションは、NMAの結果に対 するパラメータの事後分布の推定を可能にするため、ここで は非常に重要な役割を果たす。

14.

ソフト

15.

糖尿病におけるネットワークメタアナリシスの一例:単なる例示であり、この考察などまったくない Diabetes diseaseで適用されたNMAの目的は、2型糖尿病患者におけるベースラインのスルホニルウレア療法に対 するHbA1c(糖化ヘモグロビン)変化に対する相対効果の推定を例として検討され、研究ではベースラインからの 平均HbA1c変化が用いられ、HbA1cの測定は3~12ヶ月の範囲の追跡調査後に行われました . このデータセットに含まれる研究は、糖尿病患者における血糖コントロールのための異なる治療法を比較したもの である。研究者らは、合計6,646人の患者と、acarbose(acar)、benfluorex(benf)、metformin(metf)、 miglitol(migl)、pioglitazone(piog)、placebo(plac)、rosiglitazone(rosi)、sitaragliptin(sita)、 sulfonylurea単独(sulf)およびvildagliptin(vild)という10の薬剤グループからなる26件のスタディを選んだ。 対応するネットワークでは、15種類のデザイン(すなわち、1つの研究で比較される治療法のセット)があった。 データには、治療効果(TE)、ここでは効果をMDと紹介、効果の標準誤差(seTE)、治療名、そして最後に各研 究の名前が記録されている。 効果指標は血中グルコース濃度のMDであり、固定効果モデルを用いた。ネットワークの可視化は、netmeta R統 計パッケージを用いて行った。 Pスコア測定によるネットワーク内の治療のランキング(ランコグラム)に基づき、上位3つの介入は、最も効果的 と思われるロシグリタゾン治療(1P-score=0. 978)、メトホルミン(2Pスコア=0.851)、ピオグリタゾン(3P スコア=0.768)であり、対応するSUCRA値はほとんど乖離していない(ロシグリタゾン=0.983、メトホルミン 0.852、ピオグリタゾン0.766). しかし,臨床医や意思決定者は,使用したエビデンスの質とNMAの結果の信頼性を考慮しない限り,ある介入が1 位だからといって最良と考えるべきではない。

16.

考察1:間接比較などの問題点について NMAが利用できる状況:一般に、通常のネットワーク接続が可能であり、サンプルサイズが十分である場合、NMA は統計的検出力の向上をもたらすことができる。 NMAが利用できない状況:ネットワーク接続性を「測定」する数学的アプローチが存在するが、これらの指標を算 出するためには生データが必要である(39、115)。しかし、NMAの不適切な使用は、ネットワーク接続性が低い ため統計的検出力が低い場合、または結果が間接データに由来する場合、観察には変わりないが、それにもかかわ らず十分に注意して解釈されていない場合など、誤った結果につながることがある。 間接比較についての問題点の議論:間接的な治療比較については、研究者の間で、意思決定における使用の妥当性、 特に直接的な治療比較も可能な場合の妥当性について意見が分かれている。 具体的には、(特に治療が直接比較されていない場合)情報が不完全である可能性があるため、順位確率のみに基 づいて意思決定を行うべきではないと主張されている。 また、順位確率の推定値は、ネットワーク内の比較ごとの研究数の不均等、個々の研究のサンプルサイズ、ネット ワーク全体の構成、治療間の効果量などの要因によって影響を受けるため非常に繊細である。例えば、比較対象ご との研究数が不均等な場合、治療効果の推定精度のばらつきが大きくなるため、検討した各ネットワークの治療順 位確率に偏りが生じ、NMA解析が不正確になる可能性がある。 NMAも問題点に対する対策について:このような理由から、研究者がtransitivityとconsistencyを評価するために どのような戦略を取ろうとしているのかを詳細に報告し、計算方法を明確にすることが必要である。また、ランキ ングの良し悪しが必ずしも臨床的に重要な効果量を意味するわけではなく、一方、NMAから導かれた治療ランキン グは、しばしばある程度の不正確さを示すことがあるので、臨床医は効果量と治療ランキングについて常に慎重に なる必要がある。これは、その不確実性が無視できるため、相対的な効果が偶然を超えてゼロと異ならない場合、 ランキングはある介入が他の介入よりも優れているような錯覚を与えるからである。 NMAの利点について:しかし、それでもNMAはペアワイズメタ解析よりも重大な利点がある。特にエビデンスの循 環がある場合(ループ)、ベイズNMAアプローチは、個別のペアワイズメタ解析と比較して効果推定値を大幅に改 善することが示されている。

17.

考察2:NMAを行う前に考える事 NMAを構築する前に考慮すべきであり、研究者が結果をさらに改善するのに役立つもう一つの同様に重要な側面に ついて:上述のように、ネットワークの幾何学、ひいてはネットワークに含まれるノード(治療)の数を探索する ことであり、意思決定者はネットワークのすべての対比較に興味があるとは限らないからである。 したがって、2つの有効な治療法の間の治療効果は、すべての有効な治療法とプラセボの相対的な効果よりも意思 決定に影響することが多いため、研究者は、利用可能な治療法のサブセット、すなわち臨床的により関連があると 考えられるもの(最も有効な治療法)のみを使用してネットワークを修正できる。 そうでない場合は、臨床的に関心のない治療を比較するデータを主要な研究に含めることで、臨床的関心のある間 接的な証拠を追加し、推定値の精度を高めることができるが、さらなる矛盾を引き起こす可能性もある。 ネットワーク研究では、様々な異なる基準に基づいて試験や特定の比較対象を除外することが一般的であるが、こ れはRCTで評価された可能性のあるすべての介入を含めることを選択すると、不明瞭で落胆させる結論になるから である。 結局のところ、いくつかの試験は他の試験から大きく逸脱しており、NMAでそれらを組み合わせることは望ましく なく(試験レベルの外れ値)、研究では対応するベイズ外れ値検出手段が提案されている。 しかし、NMAから治療法を導き出すと、効果推定値が大きく変化するため、最も適切な治療法の確率順位が変わる 可能性がある。つながりの深い治療が最も影響力を持つようである。その結果、結果に最も大きな影響を与えるの は、よくつながったノードを削除したときであり、そのため、ネットワークが有効であるためには、ある症状につ いて利用可能な最も評価される治療が必要であると考える必要がある。 NMAの形状における小さな「変異」が解析に直接影響を与え、ひいては意思決定プロセスに影響を与えるため、潜 在的なノードの除外に関しては特別な注意が必要であり、適格基準に関する決定は慎重に正当化されなければなら ない。そのため、「ノード生成」プロセスはNMAにおける最も重要な問題の1つとして認識されており、治療ノー ドの生成方法が異なれば結果に大きな影響を与える可能性がある。 しかし、ネットワークサイズに加えて、グラフ情報を補完するために、特定のグラフ理論の統計的尺度の記述を取 り入れることが提案されている。特に、類似のNMAを区別するために、最初のレビューで「交絡」が確認され、異 質性がないことを推測する場合、特に研究が少ない場合に感度分析を行うことが重要である。

18.

考察3:ノードの定義が重要であるもう一つの理由 ノードの定義が重要であるもう一つの非常に強い理由:介入が複数の治療と組み合 わされることである。 研究者は、治療群を組み合わせる傾向があり、異なる特徴を持つ治療や、同じグ ループに属さない異なるサブタイプの患者を、ノードで1つの治療として統合する ことが一般的である。 これには、ネットワークの統計的検出力を高める、あるいはネットワークをつなぐ という目的があり、その結果、ネットワークに偏りが生じる。 最も単純なアプローチは、各組み合わせをNMAの異なるノードとして分析すること である。 さらに、1つの大規模RCTよりも複数の小規模RCTにまたがるメタアナリシスの方 が価値が高いというエビデンスもある。 試験には常に結果に影響を与える交絡因子が存在するため、試験間の治療効果のば らつきは、RCTよりも平均効果をよりよく推定することができる。あるシミュレー ション研究では、治療効果が本当に相加的である場合、「従来の」NMAモデルはそ れらを上回らないことが示された。

19.

考察4:非ランダム化データの取り込み NMAの注目すべきベンチャーは、ごく最近行われ、着実に地位を確立しつつある、相対的な治療効果を評価するた めの非ランダム化データの取り込みであり、特にランダム化データが限られている場合、切断されたネットワーク 現象を回避するためである。 非ランダム化試験から得られた現実のエビデンスを取り入れることで、RCTから得られた知見を確認することがで き、それによって結果の正確性が増し、意思決定プロセスに力を与えることができる。 質の高いメタアナリシスは、個々の研究データの利用可能性に大きく依存するため、NMAにおけるIPDの使用は、 今日の科学界でますます認識されている。より具体的には、様々な割合の個別患者データ(IPD)研究を1つの NMAに統合すること、および集計データ(AD)とIPDを同じNMAに統合することの利点が検討されてきた。 これは、標準的なNMA手法が、効果修飾因子が集団間でバランスしていると仮定して、複数の研究からの集計デー タを結合するためである。母集団適合法のような新しい方法は、この仮定を緩和する。そのようなアプローチの1 つは、メタ回帰モデルで各研究からのIPDを分析することである。 IPDに基づくNMAは、推定治療効果の精度を高めることにつながる。さらに、参加者レベルの効果修飾因子を調整 し、欠損回答データを扱うより高度なモデルを採用することで、ネットワークの一貫性を改善し、研究間の異質性 を説明することができます。このようなデータの入手は常に可能というわけではないが、IPD率を高めると、ほと んどのモデルでより正確な推定値になることが示されており、これらの方法にはさらなる評価が必要である。典型 的な例は、最新のアプリケーションとしてのマルチレベルネットワークメタ回帰( ML-NMR)法で、この場合、集 団の決定対象に対する推定値を提供するIPDとADの混合研究からのデータを合成するためのNMAの一般化である。 このメタアナリシスの利用は、個別研究を含む集団調整の未来でもあり、腫瘍学などの医学分野で特に重要な予後 モデルや予後因子などの分野にも拡張可能である。

20.

まとめ NMAがますます普及し、したがって科学界に影響力を持つようになると、 オリジナルデータの透明性とより信頼性の高い合成に対する要求が高まる ため、統計的ネットワークの概念に精通することは一方通行になるであろ う。 メタアナリシスのためのデータベースに属するこれらのデータを、経験豊 富な研究者の意見と組み合わせて充実させることで、目的の結果に対して より信頼性の高い予測モデルの構築を向上させることができる。 しかし、これは、NMAの構築と研究は常に詳細なプロトコルに基づくべき であるという前提で行われるべきであり、状況証拠の選択的使用などの決 定から保護する唯一の方法である。 いずれにせよ、統計ツールとしてのNMAは、臨床現場における複数の競合 する介入の比較結果を評価するために非常に有用であり、さらなる医療技 術開発のためのメタアナリシスにおける「次のステップ」であることは間 違いない。 しかし、NMAの基礎となる基本的な方法論を健康研究者が理解し、これら の結果を解釈し検証する能力を最大限に発揮できるように、より専門的な トレーニングが必要である。

21.

A simple formula for enumerating comparisons in trials and network meta-analysis https://www.ncbi.nlm.nih.gov/pmc /articles/PMC 6402080/

22.

はじめに ある治療法の絶対的な有効性を知るためには、一対比較試験ですべ ての既存薬とプラセボを比較し、相対的な効果を比較するのが理想 的である。 しかし、薬剤の一対比較の中には、試験内で全く検証されていない ものもある。このため、実施された研究と実施されるべき、あるい は実施できたはずの研究との間にギャップが生じ、治療法の公正な 試験におけるギャップが浮き彫りになってしまうのである。 2群間試験では、1つのペアワイズ比較が行われる。しかし、3群間 試験では3つ、6群間試験では15個のペアワイズ比較が行われる。1 つの試験でどれだけの比較ができるかを見失いがちである。 この論文では、1つの試験や計画されたネットワークメタ解析の中 で可能な比較の数を事前に列挙するための簡単な公式を説明する。

23.

The formula ここで、nは1つの研究またはネットワークにおけるアームの数、Nは一対比較 の数であり、以下の式でこれを解きます: N=(n*( n-1))/2 ここで、n>0である; n は自然数である; そして、すべての介入は、それ自身を除く他のすべての介入と比較されるので、 次のようになる: n*( n-1); Nは双方向の比較(X対Y=Y対X)であるため、次のようになる: ( n*( n1))/2である; これは組合せ論で確立された公式で、ある集合の中にあるアイテムの数に対し てペアの数を計算するためのものです。

24.

2~10の介入によるネットワークは、それぞれ線、三角形、四角形、五角形、六角形、七角形、八 角形、非角形、十角形の形をしたネットワークを作る。5つの介入と(5*(5-1))/2=10のペアワイ ズ比較のネットワークの視覚的証明が図1に示されている. 試験やネットワークに新しい介入を追加すると、n-1個の新しいペアワイズ比較が作成される。 例えば、試験で6つのアーム、またはネットワークメタ分析で6つのノードがある場合、(6*(61))/2=15の比較がある。新しい介入(6+1=7)を追加すると、個々の試験で7-1=6の新しい対 の直接比較が、ネットワークメタ分析で6の直接または間接比較が生まれる。 (6*(6-1))/2=15 (7*(7-1))/2=21 21-15=6

25.

公式を試す 我々は、以前に発表したネットワークメタ解析のオープンデータを使用し て、ネットワーク内の比較を再作成し列挙した。ネットワーク内の試験で 報告された直接比較を用いて、計算式を適用し、潜在的または予想される 比較の数(計算式から導き出された)とネットワーク分析で報告された実 際の数または観察された数を比較しました。 我々は、以前のネットワークメ タ解析に含まれる133の研究す べてを含む、小規模な研究ベー スの登録簿を作成し、多重カウ ントの落とし穴を避けた。これ らの試験は、8つの介入からの 比較を報告した。我々の公式を 用いると、8つの介入は28のユ ニークな比較を生み出すはずで ある:(8*(8-1))/2=28 ( 図2).

26.

実際の試験内での比較の報告 オープンデータから個別の介入群を抽出し、試験内の直接比較を作成し直 した。試験は2群または3群であったため、各試験は2つまたは3つの比較を 作成することができた。 その結果、133の研究で163の比較があり、その大半は重複していた。 これらの重複を除去した後、8つの介入について、1つの比較につき1~47 の研究による16のユニークな直接比較を作成した。 これらの16の観察された比較は、上記の式を用いて予想された28の57% である。 しかし、最終論文では、成人の小児のサブグループに分けたり、アウトカ ムに分けたりしたので、5つのネットワーク図を提示した。この中には、 介入がなかったりして、直接比較数は、6(3ネットワーク)、11(1ネッ トワーク)、13(1ネットワーク)と様々であった。 よって、ペアワイズメタ解析の対象となった比較は21.42%から46.42% に過ぎなかった。

27.

ネットワークメタアナリシスプロットでの比較 最終論文より、公式の使用によって期待される比較の約42%( 21.42~46.42%)が、 直接的に試験で検証されていないことが計算できます。 これは、直接的なエビデンスギャップである。欠落している比較の数は、6つの介入を 行う3つのネットワークでは15件中9件、8つの介入を行う1つのネットワークでは28件 中17件、8つの介入を行う別のネットワークでは28件中15件と様々であった。 しかし、公式の使用によって予想される28の比較は すべて利用され、ネットワークメタ解析の中で報告 された。ネットワークレビューのプロトコルに従う か、あるいは事後的な除外によって、公式によって 予測された比較の一部が不適格と判断された可能性 があるが、この特定のレビューではそのようなこと はなかった。 この図は、study-based registerに登録された試験 のうち、ペアワイズメタ解析に含めることができた のは、一部の比較だけであることを示している。さ らに、ネットワークメタ解析における比較の数(計 算式で算出)は、介入のネットワークにおけるすべ ての比較を含み、たとえ比較が試験やペアワイズメ タ解析にないとしても、可能性のあるすべてのユ ニークな比較を含む、より大きなものとなっている。

28.

ディスカッション・結論 この式は、提案されたネットワークメタ分析で理論的に可能 な比較の総数(直接および間接の合計)を推定する際に採用 することができる。理論的に可能な比較の数と、実際にネッ トワークメタ分析で採用された比較の数には、時として食い 違いが生じる可能性がある。この式は、研究者や読者のため にこのことを強調し、分析の前後に、特定の比較が含まれな かった理由の説明を容易にするものである。 この式は、単一の試験またはネットワークメタ分析における 潜在的な比較の正確な列挙を生成する。 データの潜在的な可能性とネットワークメタ分析における実 際の比較数との間の不足は、事前に設定された適格基準や事 後的な除外を参照することで説明できるはずである。