1.7K Views
August 31, 24
スライド概要
診療ガイドラインの説明2024年8月
エビデンスレベル・エビデンスプロファイルを作る・NCCNの問題点。Mindsの間違いあり
信頼できる診療ガイドラインを見極めるために システマテックレビューと診療ガイドライン作成方 法の考え方を理解しよう 少し概念的な話もあるので、頑張ろう 湯浅秀道 大塚国際美術館
◯◯について、教科書では、「A薬を投与すること」と記載してありました。 それは、ちょっと古いかな。 最新の診療ガイドラインに は、どのように書いてあった のかな? ちょっと、理解が不十分かな・・・。 そもそも、すべての診療ガイドラインが正しい のか? 診療ガイドライン自体の作成方法に問 題がある、診療ガイドラインもあるのではない か?と疑う。
えっ、 診療ガイドライン そのものも、 疑うの?
本日は、教科書と診療 ガイドラインの違いだ けでなく、診療ガイドラ インそのものが信頼で きるかどうかまで見極 める知識を、身につけ てもらいます!
本日のメニュー 1. 診療ガイドラインの定義と教科書との違い 2. 最近のシステマテックレビューは、系統的に集めてメタ分析 をするだけではない 3. 診療ガイドラインでは、推奨を決めるのに、どのような要因 に基づいているのか理解する 4. NCCNの診療ガイドラインにはないが、一般的な診療ガイド ラインには、ルールに従った表が存在する⇒この表で信頼で きるかを確認できる! 5. エビデンスの確実性を評価するための表を実際に作って理解 を深める 6. アドバンス:Mindsの手引きは、良く読むと正しくても、誤 解されやすい記載があり、実際に誤解されて使われている
本日のメニュー 1. 診療ガイドラインの定義と教科書との違い 2. 最近のシステマテックレビューは、系統的に集めてメタ分析 をするだけではない 3. 診療ガイドラインでは、推奨を決めるのに、どのような要因 に基づいているのか理解する 4. NCCNの診療ガイドラインにはないが、一般的な診療ガイド ラインには、ルールに従った表が存在する⇒この表で信頼で きるかを確認できる! 5. エビデンスの確実性を評価するための表を実際に作って理解 を深める 6. アドバンス:Mindsの手引きは、良く読むと正しくても、誤 解されやすい記載があり、実際に誤解されて使われている
診療ガイドラインの定義 世界的なHealth and Medicine Division of the National Academies(旧IOM)による定義に遵守したMindsの定義 健康に関する重要な課題について、医療利用者と提供者の意 思決定を支援するために、システマティックレビューにより エビデンス総体を評価し、益と害のバランスを勘案して、最 適と考えられる推奨を提示する文書。 (Minds診療ガイドライン作成マニュアル編集委員会. Minds診療ガイドライン作成マニュ アル2020 ver.3.0.公益財団法人日本医療機能評価機構EBM医療情報部.2021.3頁) これについては、基礎知識の解説後に振りかえります。
著名な先生の総論や教科書と診療ガイドラインの違い 著名な先生が、経験と知識を駆使して、文章を作成し、 それに従った参考文献を数多く明記するので参考になる。 その分野の学習に必須であるが、次からのスライドで示すような問題点がある ことを理解する必要がある。それを補うのが、診療ガイドラインである。 作成:dreamstudio
世界中の研究・論文を集めて、丁寧に適格基準で選定した ら、4論文がありました 表:X薬のがん治療の仮想研究例 ――――――――――――――――――――――― がん縮小 死亡率減少 ――――――――――――――――――――――― Aihara論文 効果あり 効果なし Nangou論文 効果あり 効果なし Yuasa論文 少し効果あり 少し効果あり Andou論文 効果なし 効果なし ――――――――――――――――――――――― Yuasa 論 文 : Yuasa et. al. : Clinical Cancer Journal 118. 2014. 30-38. (仮想例) たとえば、X薬のがん治療に 4個の論文があったとする。 これを見ると、がん縮小には 効果がありそうだが、死亡 率減少の効果はなさそうな ことがわかる。
教科書を見ると・・・ 表:X薬のがん治療の仮想研究例 ――――――――――――――――――――――― がん縮小 死亡率減少 ――――――――――――――――――――――― Aihara論文 効果あり 効果なし Nangou論文 効果あり 効果なし Yuasa論文 少し効果あり 少し効果あり Andou論文 効果なし 効果なし ――――――――――――――――――――――― Yuasa 論 文 : Yuasa et. al. : Clinical Cancer Journal 118. 2014. 30-38. (仮想例) 参考文献には、4つの研究 が引用されていたが、本文 には、 「Yuasaの研究より、X薬は がん治療に効果があった 3)。」のみしか記載されてな かった。
すなわち、エビデンスに基づくと称して、都合の良い論文の都合の良い 結果を恣意的に選んでないか? 表:X薬のがん治療の仮想研究例 ――――――――――――――――――――――― がん縮小 死亡率減少 ――――――――――――――――――――――― Aihara論文 効果あり 効果なし Nangou論文 効果あり 効果なし Yuasa論文 少し効果あり 少し効果あり Andou論文 効果なし 効果なし ――――――――――――――――――――――― Yuasa 論 文 : Yuasa et. al. : Clinical Cancer Journal 118. 2014. 30-38. (仮想例) 都合の良い解説 写真AC
恣意的な選択をしないためには、アウトカムごとに、縦読みを行なう。 表:X薬のがん治療の仮想研究例 ――――――――――――――――――――――― がん縮小 死亡率減少 ――――――――――――――――――――――― Aihara論文 効果あり 効果なし Nangou論文 効果あり 効果なし Yuasa論文 少し効果あり 少し効果あり Andou論文 効果なし 効果なし ――――――――――――――――――――――― Yuasa 論 文 : Yuasa et. al. : Clinical Cancer Journal 118. 2014. 30-38. (仮想例) 効果ありそ うですか? 効果ありそ うですか? イラストAC
恣意的な選択をしないためには、アウトカムごとに、縦読みを行なう。 これを作成のルールの基本とするのが診療ガイドライン。 表:X薬のがん治療の仮想研究例 ――――――――――――――――――――――― がん縮小 死亡率減少 ――――――――――――――――――――――― Aihara論文 効果あり 効果なし Nangou論文 効果あり 効果なし Yuasa論文 少し効果あり 少し効果あり Andou論文 効果なし 効果なし ――――――――――――――――――――――― Yuasa 論 文 : Yuasa et. al. : Clinical Cancer Journal 118. 2014. 30-38. (仮想例) 効果ありそう 効果なさそう 「がん縮小」と「死亡率減少」のどちらに、患者が価値観を重要視するかの検討も必要となる。
その最初のルールが、「健康に関する重要な課題について、システマティックレ ビューを行う事」 システマティックレビューの論文は読んだことがあるよ。 いろいろな論文をまとめた、エビデンスレベルが高い論文だよね。 ちょっと、理解が不十分かな・・・。 まず、エビデンスレベルという用語から確認 しよう。
エビデンスレベルを紹介していた、元の表を確認する:2011年の頃
ランダム化比較試験によるシステマテックレビューとの記載。 よって、システマテックレビューのエビデンスレベルが高いん だ~と思いますよね。
実は、こんな所に・・・
• 試験間での不一致、または絶対的な効果量が きわめて小さいと、レベルは試験の質、不正確 さ、間接性(試験のPICOが質問のPICOに合致し ていない)に基づいて下がることがある。効果量 が大きいか、または極めて大きい場合には、レ ベルは上がることがある。 ** 従来通り、一般にシステマティックレビューの方 が個別試験よりも好ましい。
システマテックレビューだからと言っても、その中の • 試験間での不一致、または絶対的な効果量が 各研究の結果が不一致ならレベルが下がるなどの きわめて小さいと、レベルは試験の質、不正確 記載がある。 さ、間接性(試験のPICOが質問のPICOに合致し ⇒これが、どういうことかを、次のスライドから、具体 ていない)に基づいて下がることがある。効果量 的にみていきます。 が大きいか、または極めて大きい場合には、レ →これを体系的・客観的なアプローチとしたのが、 ベルは上がることがある。 GRADEアプローチであり、「5.エビデンスの確実性を 評価するための表を実際に作って」みると、同じ事を ** 従来通り、一般にシステマティックレビューの方 言っているのがしっかりと理解できます。 が個別試験よりも好ましい。
本日のメニュー 1. 診療ガイドラインの定義と教科書との違い 2. 最近のシステマテックレビューは、系統的に集めてメタ分析 をするだけではない 3. 診療ガイドラインでは、推奨を決めるのに、どのような要因 に基づいているのか理解する 4. NCCNの診療ガイドラインにはないが、一般的な診療ガイド ラインには、ルールに従った表が存在する⇒この表で信頼で きるかを確認できる! 5. エビデンスの確実性を評価するための表を実際に作って理解 を深める 6. アドバンス:Mindsの手引きは、良く読むと正しくても、誤 解されやすい記載があり、実際に誤解されて使われている
X薬のがん治療の仮想研究例をシステマテックレビューで メタ分析したら 研究名 がんの抑制効果 Andou1) 1/20 vs 10/20 RR=0.10 効果なし Yuasa2) 28/45 vs 20/55 RR=1.71 少し効果 Nangou3) 15/55 vs 5/65 RR=3.55 効果あり Aihara4) 9/32 vs 3/38 効果あり Kousei5) 相対危険度 RR=3.56 記載なし 1.62 メタ分析・ meta analysis
もし、各論文が、丁寧か、いい加減か、を調べて見たら・・・ 研究名 がんの抑制効果 Andou1) 1/20 vs 10/20 RR=0.10 効果なし Yuasa2) 28/45 vs 20/55 RR=1.71 少し効果 Nangou3) 15/55 vs 5/65 RR=3.55 効果あり Aihara4) 9/32 vs 3/38 効果あり Kousei5) 丁寧に作られていた バイアスのリスクが低い 相対危険度 RR=3.56 記載なし いい加減に作られていた バイアスのリスクが高い 1.62 この効果推定値の確実性は、 高いですか・低いですか
各研究のバイアスのリスク(従来の表現では研究の質)が低いと・・・ 研究名 がんの抑制効果 Andou1) 1/20 vs 10/20 RR=0.10 効果なし Yuasa2) 28/45 vs 20/55 RR=1.71 少し効果 Nangou3) 15/55 vs 5/65 RR=3.55 効果あり Aihara4) 9/32 vs 3/38 効果あり Kousei5) 丁寧に作られていた バイアスのリスクが低い 相対危険度 RR=3.56 記載なし いい加減に作られていた バイアスのリスクが高い 1.62 この値の確実性は、低い
もし、各研究の結果のバラツキが、以下のようだったら? Andou1) Andou1) Yuasa2) Nangou3) Yuasa2) Aihara4) Nangou3) Aihara4) 0.0 0.0 メタ分析:1.62 メタ分析:1.62 同じ1.62でも、右と、左では、 どちらが、確実性が高いでしょうか?
各研究の結果が不一致ならば・・ Andou1) Andou1) Yuasa2) Nangou3) Yuasa2) Aihara4) 0.0 メタ分析:1.62 同じ1.62でも、確実性が低い Nangou3) Aihara4) 0.0 メタ分析:1.62 同じ1.62でも、確実性が高い
このような、エビデンスの確実性を下げる要因をまとめると 5つあることが明確化された 研究の限界 (limitation, risk of bias) 非一貫性 (inconsistency) もし、そのアウトカムの結果を構成する、いろい ろな論文にバイアスが多く存在していたら・・・、 もし、論文間で、結果が異なっていれば・・・、 非直接性 もし、最初に想定した臨床の疑問の患者層と、選 択した論文の患者層が異なっていれば・・・、 不精確さ もし、症例数の小さな、あまり精確でないデータ を、メタ分析と称して、集めて有意差がでただけ だったら・・・、 (indirectness) (imprecision) 出版バイアス (publication_bias) もし、有意差がなかったからと報告されなかった 論文や、都合が悪いので論文に書かなかったアウ トカムが、たくさんありそうな状況だった ら・・・、
この「エビデンスの確実性:Certainty of evidence」の呼び方は、 時期によって異なっていたので、少し解説すると 2014年までのMindsの資料など :エビデンスレベル 2018年までのコクランレビュー :エビデンスの質 2019年までのMindsの資料 :エビデンスの強さ 2019年からのコクランレビュー 2020年よりのMinds(資料で異なる):エビデンスの確実性 このエビデンスの確実性を客観的に評価する方法論を、GRADE アプローチとよび、WHOなど世界中で使われている
先ほどの、エビデンスレベルの元表に戻ると 実は、こんな所に・・・
• 試験間での不一致、または絶対的な効果量が きわめて小さいと、レベルは試験の質、不正確 さ、間接性(試験のPICOが質問のPICOに合致し ていない)に基づいて下がることがある。効果量 が大きいか、または極めて大きい場合には、レ ベルは上がることがある。 ** 従来通り、一般にシステマティックレビューの方 が個別試験よりも好ましい。
2011年以前から、システマテックレビューの中のエビデンスの確実性を評価 する必要性が言われていたにもかかわらず、 システマテックレビューとか、ランダム化比較試験なら、エビデンスレベルが高い との誤解が広まっていた。
すなわち、システマテックレビューの結果(メタ分析の値)のみが一人歩 きすると、システマテックレビューだから結果は有効だと言う、間違った 解釈が行なわれる可能性がある 相対危険度 1.62
よって、システマティックレビューのメタ分析の結果は、数字に必ず確 実性という紐をつけておく(これが世界の主流になってきているが、ま だ、行なってない先生も多い) 確実性の程度 相対危険度 1.62
従来のシステマティックレビュー 系統的・網羅的 に検索後、研究 をまとめる メタ分析 最新のシステマティックレビュー エビデンスの確実性の評価 系統的・網羅的 に検索後、研究 をまとめる メタ分析
必ず理解して欲しいこと システマティックレビューの質が高くても、 中のメタ分析の結果(効果推定値)のエビデンスの確実性は、 高い場合と、低い場合がある。 ステップ1: SRそのものの作り方は? ステップ2: 元となる各研究のバイア スや症例数、研究間の不 一致や疑問との相違は? しっかりと作られてない SR ---→ SRの質とエビデンスの 臨床判断に使えるの 確実性をまとめると? か? SRの質が低い 得られた結果を使っ てはいけない できの良くない研究や、 各研究結果が不一致 SRの質は高いが、その 得られた結果を使う 中のエビデンスの確実 が臨床判断に使えな 性が低い い可能性がある 良質な研究であり、各研 究結果も一致 SRの質は高く、その中 得られた結果を使う のエビデンスの確実性 ことが十分にできる も高い しっかりと作られたSR
本日のメニュー 1. 診療ガイドラインの定義と教科書との違い 2. 最近のシステマテックレビューは、系統的に集めてメタ分析 をするだけではない 3. 診療ガイドラインでは、推奨を決めるのに、どのような要因 に基づいているのか理解する 4. NCCNの診療ガイドラインにはないが、一般的な診療ガイド ラインには、ルールに従った表が存在する⇒この表で信頼で きるかを確認できる! 5. エビデンスの確実性を評価するための表を実際に作って理解 を深める 6. アドバンス:Mindsの手引きは、良く読むと正しくても、誤 解されやすい記載があり、実際に誤解されて使われている
診療ガイドライン作成の、次のルールが、「エビデンス総体を評価し、益と害 のバランスを勘案して、最適と考えられる推奨を提示すること」 エビデンス総体の評価は、先ほどのシステマテックレ ビューでのメタ分析の値とエビデンスの確実性のこと だな。 でも、結果で有意差があれば、治療をしても良い のでしょう? https://medical.nikkeibp.co.jp/leaf/all/c ancernavi/news/202406/584658.html ちょっと、理解が不十分かな・・・。 まず、結果の有意差より、臨床的に意味のあ る効果の大きさと、害のバランスや、価値観 なども考慮する必要があります。
確実性が高く、値も効果があったとしても・・・ 確実性:高い 効果あり しかし、害などがあれば・・・
すなわち、患者へ、その治療を推奨するためには、利益だけでな く、害・コスト・患者の価値観なども考慮しなければならない 害 コスト 利益 患者価値 確実性
すなわち、患者へ、その治療を推奨するためには、利益だけでな Evidence-to Decision (EtD)表として、まとめる く、害・コスト・患者の価値観なども考慮しなければならない 判断 利益 害 確実性 患者価値 コスト 問題 いいえ おそらく、いい え おそらく、はい はい さまざま 分からない 望ましい効果 わずか 小さい 中 大きい さまざま 分からない 望ましくない効果 大きい 中 小さい わず か さまざま 分からない エビデンスの確実性 非常に低 低 中 高 価値観 採用研究なし 重要な不確実 重要な不確実 重要な不確実 重要な不確実 性またはばらつ 性またはばらつ 性またはばらつ 性またはばらつ きはおそらくな きあり きの可能性あり きはなし し 効果のバランス 比較対照が優 位 比較対照がお そらく優位 介入も比較対 象もいずれも優 位でない おそらく介入が 優位 容認性 いいえ おそらく、いい え おそらく、はい 実行可能性 いいえ おそらく、いい え おそらく、はい 介入が優位 さまざま 分からない はい さまざま 分からない はい さまざま 分からない
診療ガイドラインの定義 どうでしょうか、文章の意味が深く理解できたのでは? 健康に関する重要な課題について、医療利用者と提供者の意 思決定を支援するために、システマティックレビューにより エビデンス総体を評価し、益と害のバランスを勘案して、最 適と考えられる推奨を提示する文書。 (Minds診療ガイドライン作成マニュアル編集委員会. Minds診療ガイドライン作成マニュ アル2020 ver.3.0.公益財団法人日本医療機能評価機構EBM医療情報部.2021.3頁)
診療ガイドラインには、理解しやすいための表の記載が必要である 世界の、がんの分野では、GRADEアプローチを用いた診療ガイドラインは、 ほとんど存在しない(NCCNの診療ガイドラインで解説)。ただ、検診に ついては、行われている(ECIBCを紹介)。他の分野では、ほぼGRADEア プローチで診療ガイドラインが作られているため(WHOの診療カイドライ ンを紹介)、今後は、がん分野でも普及すると思われる。実は、癌の分野 でGRADEアプローチを使っているのは、部分的な使用であっても、日本が 多く、最先端とも言える。 ここからは、GRADEアプローチで用いられる表を理解するための解説を行 う。 また、アドバンス編として、本邦のMindsで使われている表との違いと、 間違いしやすいポイントを紹介する。
本日のメニュー 1. 診療ガイドラインの定義と教科書との違い 2. 最近のシステマテックレビューは、系統的に集めてメタ分析 をするだけではない 3. 診療ガイドラインでは、推奨を決めるのに、どのような要因 に基づいているのか理解する 4. NCCNの診療ガイドラインにはないが、一般的な診療ガイド ラインには、ルールに従った表が存在する⇒この表で信頼で きるかを確認できる! 5. エビデンスの確実性を評価するための表を実際に作って理解 を深める 6. アドバンス:Mindsの手引きは、良く読むと正しくても、誤 解されやすい記載があり、実際に誤解されて使われている
NCCNで指標とされている、NCCNエビデンスブロック ともかく、治療推奨に関する重要な情報を視覚的に表現するための指標であるが・・・。
ブロックの一つに、Quality of evidence(エビデンスの質)の評価があるので見ると [Q] Quality and quantity of evidence refers to the number and types of clinical trials relevant to a particular intervention. To determine a score, panel members may weigh the depth of the evidence, i.e., the numbers of trials that address this issue and their design. The scale used to measure quality of evidence is: •5 (High quality): Multiple well-designed randomized trials and/or meta-analyses •4 (Good quality): One or more well-designed randomized trials •3 (Average quality): Low quality randomized trial(s) or well-designed non-randomized trial(s) •2 (Low quality): Case reports or extensive clinical experience •1 (Poor quality): Little or no evidence [Q] エビデンスの質と量とは、特定の介入に関連する臨床試験の数と種類を指す。点数を決定するために、 パネルメンバーはエビデンスの深さ、すなわちこの問題を扱った臨床試験の数とそのデザインに重きを置く ことができる。エビデンスの質の測定に使用される尺度は以下の通りである: 5(質が高い): 複数の十分にデザインされたランダム化試験および/またはメタアナリシス 4(質が高い): 1つ以上の十分にデザインされたランダム化試験 3(平均的質): 質の低いランダム化試験または十分にデザインされた非ランダム化試験 2(質が低い): 症例報告または広範な臨床経験 1(質が低い): エビデンスがほとんどない、または全くない 突っ込むところが多すぎて・・・。 まず、「3の平均的質」が、平均的なのに、質の低いRCTって??質が低いRCTは、バイアスが多くて使えない かも。さらに、非ランダム化試験であり、GRADEアプローチなら、多くが確実性が非常に低となる。 「5の質が高い」でも、メタアナリシスとは、どういう意味か。メタアナリシスだけをしていても、系統的に論 文を選択してなければ、システマティックレビューとは言わないし・・・。 「十分にデザインされた」とあるが、デザインは、GRADEアプローチのエビデンスの確実性の5要因の一つだけ で、他は考慮してないの?(非一貫性については記載あり)。 「臨床試験の数」って、これを、パネルメンバーが、臨床試験の数を重視して採点しているの・・・。
あの、がん分野の世界で最も権威のあるNCCNの診療ガイドラインは・・・ 以下のカテゴリーを、パネルが、明確な基準がなく決定して、コンセンサ スを得ているだけの文章であり、診療ガイドラインの定義に従うかと言う と、非常に微妙な文書である。⇒もちろん、次に紹介する表は存在しない。 ちなみに、「ASCOのガイドライン勧告は、GRADE(Grading of Recommendations Assessment, Development and Evaluation)手法を用いて作成されている。」と、ASCOのマニュアルにあったので、NCCNと違いGRADEアプローチ採用 だ。しかし、2024年のOsteoradionecrosisのCPGは、全くGRADEアプローチに従ってなかった(^^;。
ESMOも、GRADEアプローチではなく、エビデンスレベルも旧型のようだ・・・ ESMO(を指示している人たち)は、2024年に、自分たちに自信がある ようで、NCCNの診療ガイドラインについて、「しかし、最近の研究で は、全米総合がんネットワーク(NCCN)のCPGには、質の高い研究が 存在しないことが明らかになった。」の記載。でも、この根拠の論文が、 2011年なので、さすがに・・・、いちゃもんかな? Skelin M, Perkov-Stipičin B, Vušković S, Šandrk Plehaček M, Bašić A, Šarčević D, Ilić M, Krečak I. Levels of evidence and grades of recommendation supporting European society for medical oncology clinical practice guidelines. Oncol Res. 2024 Apr 23;32(5):807-815. doi: 10.32604/or.2024.048948. PMID: 38686053; PMCID: PMC11055998. Poonacha TK, Go RS. Level of scientific evidence underlying recommendations arising from the National Comprehensive Cancer Network clinical practice guidelines. J Clin Oncol. 2011 Jan 10;29(2):186-91. doi: 10.1200/JCO.2010.31.6414. Epub 2010 Dec 13. PMID: 21149653. 比較論文(作成方法の比較がないので意味が無いよ うな気がする):Luzietti E, Pellino G, Nikolaou S, Qiu S, Mills S, Warren O, Tekkis P, Kontovounisios C. Comparison of guidelines for the management of rectal cancer. BJS Open. 2018 Jul 27;2(6):433-451 Dou R, He S, Deng Y, Wang J. Comparison of guidelines on rectal cancer: exception proves the rule? Gastroenterol Rep (Oxf). 2021 Sep 23;9(4):290-298.
ECIBC:診療ガイドラインの定義に従って、GRADEアプローチという方法論で作成さ れている、乳がんの検診と診断に関する欧州のガイドラインで使われている表 European guidelines on breast cancer screening and diagnosis https://cancer-screening-and-care.jrc.ec.europa.eu/en/ecibc/european-breast-cancer-guidelines Evidence-to Decision (EtD)表
WHOの診療カイドラインの中の、肝炎の診療ガイドラインを見てみると・・・ https://www.who.int/publications/who-guidelines
階層の深い所に、このような2つの表がある⇒この表が重要! Evidence-to Decision (EtD)表 GRADE Evidence Profile表(後で詳しく解説!) Web版では、Summary of Findings (SoF)表という簡易版 https://iris.who.int/bitstream/handle/10665/376342/B09013-eng.pdf?sequence=1&isAllowed=y#page=4.10
残念ならが、NCCNだけでなく、ESMOも、後で解説する、SoF表みたいな 表があるが、エビデンスの確実性の紐付けがなく、かつ、EtD表のよう な、推奨につながる要因の一覧表がない。 よって、どのようなエビデンスの確実性で、どのような益と害のバラン スで推奨が作られているか不明な診療ガイドラインの作成をしている。
信頼できる診療ガイドラインを見極めるポイント (1)これらの表か、同じ項目について本文に記載があるか? (2)その記載が、可能な限り客観的な資料に基づいているか? (3)システマテックレビューを行なったと書いてあるのに、◯◯のランダム化 比較試験ではA薬に有意差があったなどと、次に詳細に解説するエビデンス の確実性も関係ない、個別の研究結果の文章が並ぶだけの、トンデモ診療 ガイドラインが存在するので、疑いの目を持ちましょう! Table 1 Differences between trustworthy evidence-based guidelines from untrustworthy guidelines Lima JP, Tangamornsuksan W, Guyatt GH. Trustworthy evidence-based versus untrustworthy guidelines: detecting the difference. Fam Med Community Health. 2023 Oct;11(4):e002437. doi: 10.1136/fmch-2023002437. PMID: 37802543; PMCID: PMC10565152. https://www.ncbi.nlm.nih.gov/pmc/articles/PM C10565152/ Ghadimi, Maryam & Guyatt, Gordon & Brignardello-Petersen, Romina. (2024). Modifications to the NEATS instrument for more appropriate and reproducible assessment of guidelines trustworthiness. Clinical and Public Health Guidelines. 1. 10.1002/gin2.12025. https://doi.org/10.1002/gin2.12025
本日のメニュー 1. 診療ガイドラインの定義と教科書との違い 2. 最近のシステマテックレビューは、系統的に集めてメタ分析 をするだけではない 3. 診療ガイドラインでは、推奨を決めるのに、どのような要因 に基づいているのか理解する 4. NCCNの診療ガイドラインにはないが、一般的な診療ガイド ラインには、ルールに従った表が存在する⇒この表で信頼で きるかを確認できる! 5. エビデンスの確実性を評価するための表を実際に作って理解 を深める 6. アドバンス:Mindsの手引きは、良く読むと正しくても、誤 解されやすい記載があり、実際に誤解されて使われている
エビデンスプロファイル表の作り方は、「エビデンスの確実性の5要因」を並べて作る 基本が、ランダム化比較試験のシステマティックレビューのため、それを前提に解説する。 まず、ランダム化比較試験のメタ分析の結果である、効果推定値のエビデンスの確実性の グレードは高いと仮置きして、以下の5つの要因の問題があればグレードダウンして、4 段階のどれになるかを評価する。 研究の限界 (limitation, risk of bias) 非一貫性 (inconsistency) 非直接性 (indirectness) 不精確さ (imprecision) 出版バイアス (publication_bias) もし、そのアウトカムの結果を構成する、いろいろな論文にバ イアスが多く存在していたら・・・、 もし、論文間で、結果が異なっていれば・・・、 もし、最初に想定した臨床の疑問の患者層と、選択した論文の 患者層が異なっていれば・・・、 もし、症例数の小さな、あまり精確でないデータを、メタ分析 と称して、集めて症例数が大きくなって有意差がでただけだっ たら・・・、 もし、有意差がなかったからと報告されなかった論文や、都合 が悪いので論文に書かなかったアウトカムが、たくさんありそ うな状況だったら・・・、
それでは、仮想例を使って、この確実性を下げる5要因を評価しながら、エビデンスプ ロファイルを作ってみよう。その結果、システマテックレビューの理解でポイントとなる エビデンスの確実性が、自分でも評価できるようになるので、詳しく解説する。 No. of studies アウトカム アウトカム Design Risk of bias Inconsi stency Indirec tness Imprec ision Other consid eration s No. of patie nts Effect Certain ty Impor tance
ある薬で、癌治療が成功するか(本来なら、生存曲線などを使いますが、ここでは説 明を単純にするため、「癌治療が成功した割合」をアウトカムとします) 論文数 研究デ ザイン 癌治療が成功 研究が 偏って いるか 結果が 不一致 か 対象が相 違してい るか データ が不精 確か お蔵入り 研究が あるか 患者 数 メタ分 析の 結果 エビデ ンスの 確実性 アウト カムの 重要性
まず前段階として、データの一覧・メタ分析の結果・各論文のバイアスのリスクを評価する 研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 1/20 vs 10/20 ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 15/55 vs 5/65 ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 28/45 vs 20/55 ランダム化比較 試験 ●●●● Kita 日本 低リスク 少ない 70 9/32 vs 3/38 ランダム化比較 試験 ●●●● Kousei 日本 低リスク 適度 600 記載なし ランダム化比較 試験 ●●●● 論文数 研究デ ザイン 癌治療が成功 研究が 偏って いるか 結果が 不一致 か 対象が相 違してい るか データ が不精 確か お蔵入り 研究が あるか 患者 数 メタ分 析の 結果 エビデ ンスの 確実性 アウト カムの 重要性
研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 1/20 vs 10/20 ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 15/55 vs 5/65 ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 28/45 vs 20/55 ランダム化比較 試験 ●●●● Kita 日本 低リスク 少ない 70 9/32 vs 3/38 ランダム化比較 試験 ●●●● Kousei 日本 低リスク 適度 600 記載なし ランダム化比較 試験 ●●●● 論文数 研究デ ザイン 癌治療が成功 研究が 偏って いるか 結果が 不一致 か 対象が相 違してい るか データ が不精 確か お蔵入り 研究が あるか 患者 数 メタ分 析の 結果 エビデ ンスの 確実性 アウト カムの 重要性 重大
研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 1/20 vs 10/20 ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 15/55 vs 5/65 ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 28/45 vs 20/55 ランダム化比較 試験 ●●●● Kita 日本 低リスク 少ない 70 9/32 vs 3/38 ランダム化比較 試験 ●●●● Kousei 日本 低リスク 適度 600 記載なし ランダム化比較 試験 ●●●● 論文数 研究デ ザイン 4 研究が 偏って いるか 結果が 不一致 か 対象が相 違してい るか データ が不精 確か お蔵入り 研究が あるか 患者 数 メタ分 析の 結果 エビデ ンスの 確実性 アウト カムの 重要性
研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 1/20 vs 10/20 ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 15/55 vs 5/65 ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 28/45 vs 20/55 ランダム化比較 試験 ●●●● Kita 日本 低リスク 少ない 70 9/32 vs 3/38 ランダム化比較 試験 ●●●● Kousei 日本 低リスク 適度 600 記載なし ランダム化比較 試験 ●●●● 論文数 研究デ ザイン RCT 研究が 偏って いるか 結果が 不一致 か 対象が相 違してい るか データ が不精 確か お蔵入り 研究が あるか 患者 数 メタ分 析の 結果 エビデ ンスの 確実性 アウト カムの 重要性
研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 1/20 vs 10/20 ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 15/55 vs 5/65 ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 28/45 vs 20/55 ランダム化比較 試験 ●●●● Kita 日本 低リスク 少ない 70 9/32 vs 3/38 ランダム化比較 試験 ●●●● Kousei 日本 低リスク 適度 600 記載なし ランダム化比較 試験 ●●●● 論文数 研究デ ザイン 研究が 偏って いるか 結果が 不一致 か 対象が相 違してい るか データ が不精 確か お蔵入り 研究が あるか 患者 数 330 結果 の要 約 エビデ ンスの 確実性 アウト カムの 重要性
研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 1/20 vs 10/20 ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 15/55 vs 5/65 ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 28/45 vs 20/55 ランダム化比較 試験 ●●●● Kita 日本 低リスク 少ない 70 9/32 vs 3/38 ランダム化比較 試験 ●●●● Kousei 日本 低リスク 適度 600 記載なし ランダム化比較 試験 ●●●● 論文数 研究デ ザイン 研究が 偏って いるか 結果が 不一致 か 対象が相 違してい るか データ が不精 確か お蔵入り 研究が あるか 患者 数 メタ分 析の 結果 1.62 エビデ ンスの 確実性 アウト カムの 重要性
次のスライドから、グレードダウンの5要因を判定していきます 研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 1/20 vs 10/20 ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 15/55 vs 5/65 ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 28/45 vs 20/55 ランダム化比較 試験 ●●●● Kita 日本 低リスク 少ない 70 9/32 vs 3/38 ランダム化比較 試験 ●●●● Kousei 日本 低リスク 適度 600 記載なし ランダム化比較 試験 ●●●● 論文数 研究デ ザイン 研究が 偏って いるか 結果が 不一致 か 対象が相 違してい るか データ が不精 確か お蔵入り 研究が あるか 患者 数 結果 の要 約 エビデ ンスの 確実性 アウト カムの 重要性
研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 1/20 vs 10/20 ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 15/55 vs 5/65 ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 28/45 vs 20/55 ランダム化比較 試験 ●●●● Kita 日本 低リスク 少ない 70 9/32 vs 3/38 ランダム化比較 試験 ●●●● Kousei 日本 低リスク 適度 600 記載なし ランダム化比較 試験 ●●●● 論文数 研究デ ザイン 研究が 偏って いるか あり 結果が 不一致 か 対象が相 違してい るか データ が不精 確か お蔵入り 研究が あるか 患者 数 メタ分 析の 結果 エビデ ンスの 確実性 アウト カムの 重要性
研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 効果なし ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 効果あり ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 効果あり ランダム化比較 試験 ●●●● Kita 日本 低リスク 少ない 70 効果あり ランダム化比較 試験 ●●●● Kousei 日本 低リスク 適度 600 記載なし ランダム化比較 試験 ●●●● 論文数 研究デ ザイン 研究が 偏って いるか 結果が 不一致 か あり 対象が相 違してい るか データ が不精 確か お蔵入り 研究が あるか 患者 数 メタ分 析の 結果 エビデ ンスの 確実性 アウト カムの 重要性
研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 1/20 vs 10/20 ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 15/55 vs 5/65 ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 28/45 vs 20/55 ランダム化比較 試験 ●●●● Kita 日本 低リスク 少ない 70 9/32 vs 3/38 ランダム化比較 試験 ●●●● Kousei 日本 低リスク 適度 600 記載なし ランダム化比較 試験 ●●●● 論文数 研究デ ザイン 研究が 偏って いるか 結果が 不一致 か 対象が相 違してい るか なし データ が不精 確か お蔵入り 研究が あるか 患者 数 メタ分 析の 結果 エビデ ンスの 確実性 アウト カムの 重要性
研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 1/20 vs 10/20 ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 15/55 vs 5/65 ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 28/45 vs 20/55 ランダム化比較 試験 ●●●● Kita 日本 低リスク 少ない 70 9/32 vs 3/38 ランダム化比較 試験 ●●●● Kousei 日本 低リスク 適度 600 記載なし ランダム化比較 試験 ●●●● 論文数 研究デ ザイン 研究が 偏って いるか 結果が 不一致 か 対象が相 違してい るか データ が不精 確か あり お蔵入り 研究が あるか 患者 数 330 メタ分 析の 結果 エビデ ンスの 確実性 アウト カムの 重要性
研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 1/20 vs 10/20 ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 15/55 vs 5/65 ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 28/45 vs 20/55 ランダム化比較 試験 ●●●● Kita 日本 低リスク 少ない 70 9/32 vs 3/38 ランダム化比較 試験 ●●●● Kousei 日本 低リスク 適度 600 記載なし ランダム化比較 試験 ●●●● 論文数 研究デ ザイン 研究が 偏って いるか 結果が 不一致 か 対象が相 違してい るか データ が不精 確か お蔵入り 研究が あるか なし 患者 数 メタ分 析の 結果 エビデ ンスの 確実性 アウト カムの 重要性
研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 1/20 vs 10/20 ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 15/55 vs 5/65 ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 28/45 vs 20/55 ランダム化比較 試験 ●●●● 日本 少ない 9/32 vs 3/38 ランダム化比較 ●●●● グレードダウンの5要因を使って、エビデンスの確実性が、 低リスク 70 試験 Kita 「高い・中等度・低い・非常に低」のどれかを判定します。 日本 適度 Kousei 記載なし ランダム化比較 ●●●● 低リスク 論文数 研究デ ザイン RCT 600 試験 研究が 偏って いるか 結果が 不一致 か 対象が 相違し ている か データ が不精 確か お蔵入り 研究があ るか あり あり なし あり なし 患者 数 メタ分 析の 結果 エビデ ンスの 確実性 アウト カムの 重要性 高い 中程度 低い 非常に低い
研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 1/20 vs 10/20 ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 15/55 vs 5/65 ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 28/45 vs 20/55 ランダム化比較 試験 ●●●● Kita 日本 低リスク 少ない 70 9/32 vs 3/38 ランダム化比較 試験 ●●●● Kousei 日本 低リスク 適度 600 記載なし ランダム化比較 試験 ●●●● 論文数 研究デ ザイン 癌治療が成功 4 RCT 研究が 偏って いるか 結果が 不一致 か 対象が相 違してい るか データ が不精 確か ランダム比較試験なので、 エビデンスの確実性は、「高 い」に仮決めします。 お蔵入り 研究が あるか 患者 数 メタ分 析の 結果 330 1.62 エビデ ンスの 確実性 アウト カムの 重要性
研究名 実施国 リスク 症例数 癌治療が成功 計画時のデザイ ン バイアスの リスク Mangou 日本 低リスク 少ない 40 1/20 vs 10/20 ランダム化比較 試験 ●●●● Yuasa 日本 低リスク 少ない 120 15/55 vs 5/65 ランダム化比較 試験 ●●●● Andou 米国 低リスク 少ない 100 28/45 vs 20/55 ランダム化比較 試験 ●●●● 日本 少ない Kita 9/32 vs 3/38 ランダム化比較 ●●●● 5要因の中の3つが「深刻な問題あり」なので、「高い」から3段 低リスク 70 試験 階下がって、「非常に低」となる。<これが基本的な考え方> Kousei 日本 低リスク 論文数 研究デ ザイン RCT 高い 記載なし 適度 600 ランダム化比較 試験 研究が 偏って いるか 結果が 不一致 か 対象が 相違し ている か データ が不精 確か お蔵入り 研究があ るか あり あり なし あり なし 患者 数 メタ分 析の 結果 ●●●● エビデ ンスの 確実性 アウト カムの 重要性 高い 中程度 低い 非常に低い
すいません、実際には、 さらに詳しい基準に従って厳密に評価し、「低い」と判断されます。 #1: Inconsistencyと Imprecisionが存在 した。ただし、 Mangou 2000を除 外して行った感度 分析の結果より、 この2つの要因で2 段階下げる必要は ないと判断し、 Imprecision を「な し」とした。 論文数 研究デ ザイン RCT 高い 研究が 偏って いるか 結果が 不一致 か 対象が 相違し ている か データが 不精確 か お蔵入り 研究が あるか あり あり #1 なし なし #1 なし 患者 数 メタ分 析の 結果 総合的に考えます エビデン スの確実 性 低い アウト カム の重 要性
研究名 実施国 リスク 症例数 癌治療が成功 ユーザーとしては、こんな 感じで、確実性を決めて 日本 少ない Mangou 1/20 vs 10/20 低リスク 40 いるんだ~、程度の理解 日本 少ない Yuasa で十分です! 15/55 vs 5/65 低リスク 120 もし作成するなら、勉強必 米国 少ない Andou 28/45 vs 20/55 低リスク 100 要ですけどね。 計画時のデザイ ン バイアスの リスク ランダム化比較 試験 ●●●● ランダム化比較 試験 ●●●● ランダム化比較 試験 ●●●● 日本 少ない Kita 9/32 vs 3/38 ランダム化比較 ●●●● 5要因の中の3つが「深刻な問題あり」なので、「高い」から3段 低リスク 70 試験 階下がって、「非常に低」となる。<これが基本的な考え方> Kousei 日本 低リスク 論文数 研究デ ザイン RCT 高い 記載なし 適度 600 ランダム化比較 試験 研究が 偏って いるか 結果が 不一致 か 対象が 相違し ている か データ が不精 確か お蔵入り 研究があ るか あり あり なし あり なし 患者 数 メタ分 析の 結果 ●●●● エビデ ンスの 確実性 アウト カムの 重要性 高い 中程度 低い 非常に低い
他のアウトカムも同様に評価して、 エビデンスプロファイルを完成させる No. of studie s Desig n Risk of Incons Indire Impre bias istenc ctness cision y Other conside rations No. of Effect Certai patients nty Impor tance 低い 重要 低い 重大 なし あり なし 930 平均 30 mmH g下げ た なし なし #1 なし 330 1.62 アウトカム:血圧低下 5 ランダ ム比較 試験 あり RCT あり あり アウトカム:癌治療が成功 4 あり #1
この考え方を理解すると、 研究名 実施国 症例数 計画時のデザイ バイアスの 癌治療が成功 ここまで厳密でなくても、 リスク ン リスク だいたいの感じで、エビ 日本 少ない Mangou 1/20 vs 10/20 ランダム化比較 ●●●● 低リスク 40 試験 デンスの確実性を常に評 日本 少ない Yuasa価できるはず。 15/55 vs 5/65 ランダム化比較 ●●●● 低リスク 120 試験 よって、常に、この結果 米国 少ない Andou 28/45 vs 20/55 ランダム化比較 ●●●● 低リスク 100 試験 の確実性はだいたいど 日本 少ない Kita 9/32 vs 3/38 ランダム化比較 ●●●● 5要因の中の3つが「深刻な問題あり」なので、「高い」から3段 んな感じかを意識した 低リスク 70 試験 階下がって、「非常に低」となる。<これが基本的な考え方> EBMの実践が可能となる。 日本 適度 Kousei 記載なし ランダム化比較 ●●●● 低リスク 600 試験 やったね! 論文数 研究デ ザイン RCT 高い 研究が 偏って いるか 結果が 不一致 か 対象が 相違し ている か データ が不精 確か お蔵入り 研究があ るか あり あり なし あり なし 患者 数 メタ分 析の 結果 エビデ ンスの 確実性 アウト カムの 重要性 高い 中程度 低い 非常に低い
このエビデンスプロファイルを簡単にしたものが、SoF表と言い、コクラ ンライブラリーで採用されているので解説する。 No. of studies Design Risk of bias このグレードダウンの 5要因を脚注に記載 Inconsi stency Indirec tness Imprec ision Other consid eration s No. of patie nts Effect Certain ty Impor tance 効果推定値を、相対危険度な ど比で示すだけでなく、1000 人中の絶対人数でも表示
SoF表の構造(実際の例) 77
SoF表の構造(実際の例) 絶対効果 研究数と 累計被験者数 アウトカム1 相対効果 アウトカム1のエビデンスの確実性 アウトカム1の効果の大きさ アウトカム2 アウトカム2のエビデンスの確実性 アウトカム2の効果の大きさ 脚注にグレードダウンの理由を記載 78
次に、EtD表の解説:実例より 利益だけでなく害・価値観と意向・コストなど一覧とし、読者にも推奨の 判断ができる透明性を確保するため、表として提示してある。 CQ・PICO 問題の重要性 利益の大きさなど https://guidelines.gradepro.org/profile/783DCF1B-50FC-72D0-A1E1-3C31011E9471
価値観 価値観も、単に、患者によって違いが あるな~程度でなく、 各アウトカムの相対的重要性が、根拠 となる参考文献付で記載されている 益と害の バランス この実例では、ここに、説明の記載がな かったが、実際は基準に従った評価がされ ている リソース コスト
(1)(2)などで評価した判定の一覧表 推奨のタイプと、パネリスト投票状況
すなわち、この2つの表を見ると、エビデンスの確実性がどのように評価され、 利益と害のバランスや価値観などをどのように 評価したのかが、理解できる GRADE Evidence Profile表 Evidence-to Decision (EtD)表 https://iris.who.int/bitstream/handle/10665/376342/B09013-eng.pdf?sequence=1&isAllowed=y#page=4.10
本日のメニュー 1. 診療ガイドラインの定義と教科書との違い 2. 最近のシステマテックレビューは、系統的に集めてメタ分析 をするだけではない 3. 診療ガイドラインでは、推奨を決めるのに、どのような要因 に基づいているのか理解する 4. NCCNの診療ガイドラインにはないが、一般的な診療ガイド ラインには、ルールに従った表が存在する⇒この表で信頼で きるかを確認できる! 5. エビデンスの確実性を評価するための表を実際に作って理解 を深める 6. アドバンス:Mindsの手引きは、良く読むと正しくても、誤 解されやすい記載があり、実際に誤解されて使われている
実は、本邦で多く用いられている表は、Mindsの手引きに用意されたシートである。 これは、若干、GRADEアプローチのオリジナルの表と異なり混乱しやすい。 1)各論文のバイアスリスクを評価するための表(GRADE アプローチでは、システマティックレビューの論文には記 載するが、診療ガイドラインには提示しない)。 2)GRADE Evidence Profile表と似ている表 3)EtD表と似ているが、コンセプトが異なる表
この「2)GRADE Evidence Profile表と似ている表」という、本邦で多く用いられている表は、 Mindsの手引きに用意されたシートである。 これは、若干、GRADEアプローチのオリジナルの表と異なり混乱しやすい。 Mindsのシートのが、GRADE Evidence Profileより詳しいが、分母分子のセルを分ける など、デザイン的に理解しやすいとは言えない。
さらに…、実は、評価シートの記載例に問題がある 観察研究のところに、エビデンスの確実性を下げる5要因が、明らかに下げなければならない評価 なのに、エビデンスの強さ(手引き本文は確実性だが、シートでは強さのまま)が観察研究の最初 の仮に設定する「弱い」から下げていない。これに関しては、講演者が、Mindsに指摘している。 この例に従った診療ガイドラインが数多く存在している。
さらに、本文にも、観察研究は、エビデンスの確実性の評価を下げなくて良いように誤解される表 がある。さらに、総合的評価の文章も、総合的に評価することは、先ほどエビデンスプロファイル の記載の所でも説明したように正しいが、この文章では、ともかく総合的に評価するという意味が 強くて、多くの診療ガイドラインで誤用されている。 上げる項目しか記載してない
Mindsのシートには、基本の表だけでなく、GRADEアプローチのEtD表もあるが、項目 が多い(理由は次のスライド) このMindsのオリジナルの基本の 表は個人に対する表
GRADEアプローチでは、GRADEproというWeb siteを利用して、EtD表を作成する 「個人への推奨」と、「集団への推奨」を選ぶところがあり、Mindsのシートに記載が あるEtD表は、「集団の基準」です。よって、個人でないにも関わらず、個人に間違っ て使っている診療ガイドラインがある(正式には、各委員会で項目を選択する)。 集団に対する表:Mindsのシートとほぼ同じ 追加:個人に対する表に コストの記載がないが、 容認性に含んでいる 個人に対する表
超アドバンス:とりあえず、推奨は投票して決めるので、合意率の記載が必要であるとの誤解? Minds診療ガイドライン作成マニュアル2020 ver.3.0には、合意率を記載しろという記載がないが、 なぜか本邦では、合意率の記載が流行っている。 また、GRADEアプローチのGRADE Handbook (https://gdt.gradepro.org/app/handbook/handbook.html#h.fueh5iz0cor4 )によると、「強い 推奨は、重要なアウトカムに対する効果推定値に対する確実性が高いか、少なくとも中程度であるこ とと関連している」とあり、「エビデンスの確実性が低いまたは非常に低いにもかかわらず、強い推 奨が正当化される5つのパラダイム的状況」を提示しており、エビデンスの確実性が低ければ、ほぼ 「弱い推奨」となるはずである。 しかし、本邦では、それらを無視して、投票で80%以上の合意が得られたら「強い推奨」としてい る診療カイドラインが散見される。たぶん、Mindsに記載されている、中途半端なGRADEアプロー チのの紹介の文章のみで作成していると推測される。 Minds診療ガイ ドライン作成マ ニュアル2020 ver.3.0より
プロフェッショナルに必ず理解して欲しいこと 推奨文を鵜呑みにするのではなく、 本日学んだ知識を駆使して、EtD表をみて(なくても、質の高い診療ガイ ドラインなら、その項目が記載されている) 、診療ガイドラインの推奨文 が、どのような根拠に従って作成されているかを確認する。 エビデンスプロファイル(SoF表だったり、システマテックレビューの論文 のみに記載があったりするので、探すのは大変だが、どこかに必ずあ る)をみて、エビデンスの確実性や効果推定値がどのように評価されて いるかを確認する。 口腔癌診療ガイドラ イン2019(付録)