COSMINチェックリストの概要と共通項目の理解

49.7K Views

May 24, 22

#COSMINチェックリスト #患者報告式アウトカム尺度 #HR-PROs #信頼性 #妥当性

スライド概要

患者報告式アウトカム尺度の評価法:
信頼性と妥当性の新しい国際基準COSMINチェックリストの使い方

奥村泰之

@icer

スライド一覧

一般社団法人臨床疫学研究推進機構

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

中級者による初心者のための「綿形混合モデル」

奥村泰之 229.8K

臨床疫学研究における傾向スコア分析の使い⽅〜観察研究における治療効果研究〜

奥村泰之 168.4K

「傾向スコア分析」の書き方

奥村泰之 95.3K

中級者による初心者のための「ロジスティック回帰分析」

奥村泰之 80.2K

中級者による初心者のための「探索的因子分析」

奥村泰之 66K

研究疑問とマッチした研究計画・統計解析の選び方

奥村泰之 31.4K

各ページのテキスト

患者報告式アウトカム尺度の評価法: 信頼性と妥当性の新しい国際基準COSMINチェックリストの使い方 COSMINチェックリストの概要と共通項目の理解奥村泰之一般財団法人医療経済研究・社会保険福祉協会医療経済研究機構研究部研究員公益社団法人日本心理学会心理・医学系研究者のためのデータ解析環境Rによる統計学の研究会第10回研究集会 2012/5/18 (土) 13:20~17:45 東京医科歯科大学

構成 使用目的 (6 min) 信頼性と妥当性の新定義 (3 min) チェックリストの使い方 (9 min) チェックリストの科学的評価 (2 min) 2

使⽤⽬的新定義使い⽅科学的評価英語表記 COSMIN (COnsensus-based Standards for the selection of health Measurement INstruments) 健康関連尺度の選択に関する合意に基づく指針 COSMIN (http://www.cosmin.nl/) 3

http://www.cosmin.nl/

使⽤⽬的新定義使い⽅科学的評価 COSMINのターゲット 健康関連の患者報告式アウトカム尺度 (Health Related Patient-Reported Outcomes: HR-PROs) 患者の健康状態を患者自身の直接的な報告から情報を得て，患者の回答に関して臨床家などによる修正や解釈を介さない尺度 尺度の例 症状の面接法 生活の質の質問紙 4

使⽤⽬的新定義使い⽅科学的評価健康関連の患者報告式アウトカム尺度 特徴 直接的に測定不可能 (i.e. 潜在変数) 多側面の構成 (i.e. 多因子) 実施形態 自己記入式 (i.e. 質問紙法) 他者評定式 (i.e. 面接法) コンピュータ支援式 5

使⽤⽬的新定義使い⽅科学的評価 COSMINチェックリストの使用目的文献レビューの段階 • 研究法の質の評価 • 尺度の選択 • 研究の必要性の同定計画・投稿の段階査読の段階 • 研究法の質向上 • 研究報告の質向上 • 査読の補助 COSMIN (http://www.cosmin.nl/) 6

http://www.cosmin.nl/

使⽤⽬的新定義使い⽅科学的評価事例: 研究法の質の評価 目的 慢性閉塞性肺疾患の生活の質の評価尺度の尺度特性を比較 方法 尺度研究の系統的展望 研究ごとの研究法の質を評定 尺度ごとの研究法の質を要約 Weldam SW et al: Int J Nurs Stud. in press. 7

使⽤⽬的新定義使い⽅科学的評価事例: 研究法の質の評価 7つの尺度特性を検討 研究ごとの研究法の質研究内容的構造的妥当性妥当性仮説検定異文化間内的信頼性反応性妥当性一貫性 Chronic Respiratory Questionnaire (CRQ) Chan2006 ◎ NA △ × × △ NA Tsai2008 NA ◎ △ NA × × △ Wyrwich1999 NA ○ ○ NA ◎ NA NA McGill COPD Quality of Life Questionnaire (McGill COPD) Pakhale2010 ◎ NA NA NA NA NA NA ◎ excellent; ○good; △ fair; ×poor; NA not avilable Weldam SW et al: Int J Nurs Stud. in press. 8

使⽤⽬的新定義使い⽅科学的評価事例: 研究法の質の評価 13種から4尺度を推奨 尺度ごとの研究法の質内容的構造的尺度名妥当性妥当性疾患特異的尺度 (13種類) 仮説検定異文化間内的信頼性反応性妥当性一貫性 CRQ +++ +++ +++ ? +++ ++ ++ SGRQ NA +++ ++ ? ++ +++ ++ CAT +++ +++ ++ NA +++ ++ +++ LCOPD +++ NA ++ ? +++ +++ NA McGillCOPD +++ NA NA NA NA NA NA SRI NA + NA NA + NA NA AQ20R NA NA + NA ? NA NA +++ strong evidence; ++ moderate evidence; + limited evidence; ? poor quality; NA not available Weldam SW et al: Int J Nurs Stud. in press. 9

10.

構成 使用目的 (6 min) 信頼性と妥当性の新定義 (3 min) チェックリストの使い方 (9 min) チェックリストの科学的評価 (2 min) 10

11.

使⽤⽬的新定義使い⽅科学的評価尺度特性に関する４領域の新定義信頼性妥当性内容的妥当性内的一貫性信頼性表面的妥当性測定誤差基準関連妥当性構成概念妥当性異文化間妥当性反応性反応性構造的妥当性仮説検定解釈可能性 Mokkink LB et al: J Clin Epidemiol. 2010 Jul;63(7):737-45. 11

12.

使⽤⽬的新定義領域の定義使い⽅科学的評価信頼性妥当性 信頼性 測定値に測定誤差を含まない程度反応性解釈可能性 信頼性 (拡張した定義) いくつかの条件下で反復測定したときに，変化していない人の尺度得点が同一である程度 • • • • 同一の尺度内の複数の項目セットで測定 (内的一貫性) 同一の人を複数時点で測定 (再検査信頼性) 同一の時点で異なる人が測定 (評定者間信頼性) 複数時点で同一の人が測定 (評定者内信頼性) Mokkink LB et al: J Clin Epidemiol. 2010 Jul;63(7):737-45. 12

13.

使⽤⽬的新定義使い⽅領域の定義 妥当性 尺度が目的とした構成概念を測定している程度科学的評価信頼性妥当性反応性解釈可能性 反応性 尺度が構成概念の継時的な変化を検出できる能力 解釈可能性 尺度得点に質的な意味を付与できる程度 Mokkink LB et al: J Clin Epidemiol. 2010 Jul;63(7):737-45. 13

14.

使⽤⽬的新定義使い⽅科学的評価研究会の発表分担信頼性市倉加奈子内的一貫性信頼性測定誤差内容的妥当性表面的妥当性基準関連妥当性妥当性竹林由武構造的妥当性構成概念妥当性異文化間妥当性仮説検定反応性反応性土屋政雄国里愛彦解釈可能性 14

15.

構成 使用目的 (6 min) 信頼性と妥当性の新定義 (3 min) チェックリストの使い方 (9 min) チェックリストの科学的評価 (2 min) 15

16.

使⽤⽬的新定義使い⽅科学的評価 4ステップ12ボックスの評価形式尺度特性の検討の有無の確認 A. 内的一貫性 B. 信頼性 C. 測定誤差 D. 内容的妥当性 E. 構造的妥当性 F. 仮説検定 G 異文化間妥当性 H. 基準関連妥当性 I. 反応性 J. 解釈可能性 Step 1 □ □ □ □ □ □ □ □ □ □ 項目反応理論の評価尺度特性の具体的評価 Box A. 内的一貫性利用なし Box IRT 1. 2. 3. 4. モデルソフトウェア母数推定法仮定の確認 Step 2 1. モデル 2. 共: 欠損の割合 F. 仮説検定 3. Box 共: 欠損値処理欠損の割合 4. 1.共:共: 標本サイズの適切性 5. 2.一次元性共: 欠損値処理 Box J. 解釈可能性 6. 3.標本サイズの適切性共: 標本サイズの適切性 7. 4.尺度ごとに統計量の報告 1. 共: 欠損の割合事前の仮説設定 8. 5.共:重大な研究法の欠陥関連の方向性の予測 2. 共: 欠損値処理 9. 6.クロンバックのα係数関連の大きさの予測 3. 共: 標本サイズの適切性 10. KR-20 7. 4. 他の尺度の記述 11. 適合度合計点の分布 8. 5. 他の尺度の尺度特性最低点の回答割合 9. 6. 共:重大な研究法の欠陥最高点の回答割合 10.統計手法の妥当性 7. 下位集団ごとの得点一般化可能性の評価 Box generalisability 1. 2. 3. 4. 5. 6. 7. 8. 年齢性別疾患と治療セッティング国言語標本抽出法欠損値と回収率 8. 臨床的有意性 9. 共:重大な研究法の欠陥 Step 3 Step 4 16

17.

使⽤⽬的新定義使い⽅科学的評価 Step 1: 尺度特性の検討の有無の確認 尺度研究の尺度特性をチェック A. 内的一貫性 B. 信頼性 C. 測定誤差 D. 内容的妥当性 E. 構造的妥当性 F. 仮説検定 G 異文化間妥当性 H. 基準関連妥当性 I. 反応性 J. 解釈可能性尺度特性の検討の有無の確認 A. 内的一貫性 B. 信頼性 C. 測定誤差 D. 内容的妥当性 E. 構造的妥当性 F. 仮説検定 G 異文化間妥当性 H. 基準関連妥当性 I. 反応性 J. 解釈可能性 Step 1 ☑ □ □ □ □ ☑ □ □ □ □ 17 □ □ □ □ □ □ □ □ □ □

18.

使⽤⽬的新定義使い⽅科学的評価項目反応理論の評価 Step 2: 項目反応理論の評価利用なし Box IRT 1. 2. 3. 4. 項目反応理論とはモデルソフトウェア母数推定法仮定の確認 Step 2 被験者の潜在特性 (θ) と項目の困難度 (b) を分離するテスト理論  bi e Pi     bi 1 e 統計モデルは質的変数の因子分析潜在変数 x1 x2 x3 xn 18

19.

使⽤⽬的新定義使い⽅科学的評価項目反応理論の評価 Step 2: 項目反応理論の評価利用なし Box IRT 1. 2. 3. 4. Step 2 0.2 0.4 0.6 椅子に座れる杖なしで歩ける早く歩ける 0.0 反応確率 0.8 1.0 身体機能の項目特性曲線モデルソフトウェア母数推定法仮定の確認 -4 -2 0 2 潜在特性θ=身体機能 4 19

20.

使⽤⽬的新定義使い⽅科学的評価項目反応理論の評価 Step 2: 項目反応理論の評価利用なし Box IRT モデルソフトウェア母数推定法仮定の確認 Step 2 0.2 0.4 0.6 椅子に座れる杖なしで歩ける早く歩ける 0.0 反応確率 0.8 1.0 θ=0の反応確率 (0.73, 0.50, 0.18) 1. 2. 3. 4. -4 -2 0 2 潜在特性θ=身体機能 4 20

21.

使⽤⽬的新定義使い⽅科学的評価項目反応理論の評価 Step 2: 項目反応理論の評価利用なし Box IRT モデルソフトウェア母数推定法仮定の確認 Step 2 0.2 0.4 0.6 椅子に座れる杖なしで歩ける早く歩ける 0.0 反応確率 0.8 1.0 θ=-1の反応確率 (0.50, 0.27, 0.08) 1. 2. 3. 4. -4 -2 0 2 潜在特性θ=身体機能 4 21

22.

使⽤⽬的新定義使い⽅科学的評価項目反応理論の評価 Step 2: 項目反応理論の評価利用なし Box IRT Box IRTの評価 (項目反応理論を「利用」した場合) 1. 2. 3. 4. モデルソフトウェア母数推定法仮定の確認 Step 2 1. 項目反応理論のモデルは十分に記載されているか？ • 例: 2母数ロジスティックモデル，段階反応モデル 2. 使用した統計ソフトウェアは十分に記載されているか？ • 例: MULTILOG，PARSCALE，BILOG，Mplus 22

23.

使⽤⽬的新定義使い⽅科学的評価項目反応理論の評価 Step 2: 項目反応理論の評価利用なし Box IRT Box IRTの評価 (項目反応理論を「利用」した場合) 1. 2. 3. 4. モデルソフトウェア母数推定法仮定の確認 Step 2 3. 母数推定法は十分に記載されているか？ • 例: 条件付最尤推定法，周辺最尤推定法 4. 項目反応理論のモデルの母数推定のための仮定を検討しているか？ • 例: 一次元性，局所独立の仮定，項目の適合度 23

24.

使⽤⽬的新定義使い⽅科学的評価項目反応理論の評価 Step 2: 項目反応理論の評価利用なし Box IRT 事例 1. 2. 3. 4. モデルソフトウェア母数推定法仮定の確認 方法の節 (モデル) Step 2 » One of the IRT models that is applicable to items with ordered polytomous response categories — and that we used in the present study — is the logistic GRM[Graded Response Model] (Samejima, 1969). 方法の節 (ソフトウェア/母数推定法) » In the present study, each of the unidimensional Dutch CPHI scales was analyzed separately. Item parameter estimates were obtained by the method of marginal maximum likelihood. This method is able to handle items and subjects that have missing data without deleting them or imputing missing data (Reise & Henson, 2003). The a priori distribution of the trait level (θ) was the standard normal. We used the software package MULTILOG (Scientific Software, Chicago, IL). Mokkink LB et al: J Speech Lang Hear Res. 2010 Jun;53(3):556-71. 24

25.

使⽤⽬的新定義使い⽅科学的評価項目反応理論の評価 Step 2: 項目反応理論の評価利用なし Box IRT 事例 1. 2. 3. 4. モデルソフトウェア母数推定法仮定の確認 Step 2 方法の節 (仮定の検討) » Goodness of fit of the GRM (i.e., the correspondence between model predictions and observed data) was investigated for each unidimensional scale. We examined goodness of fit of the items in the GRM as described by Stone and Zhang (2003) and as implemented in SAS (Stone, 2004). Mokkink LB et al: J Speech Lang Hear Res. 2010 Jun;53(3):556-71. 25

26.

使⽤⽬的新定義使い⽅科学的評価 Step 3: 尺度特性の具体的評価 Box A. 内的一貫性 1. モデル 2. 共: 欠損の割合 F. 仮説検定 3. Box 共: 欠損値処理欠損の割合 4. 1.共:共: 標本サイズの適切性 5. 2.一次元性共: 欠損値処理 Box J. 解釈可能性 6. 3.標本サイズの適切性共: 標本サイズの適切性 7. 4.尺度ごとに統計量の報告 1. 共: 欠損の割合事前の仮説設定 8. 5.共:重大な研究法の欠陥関連の方向性の予測 2. 共: 欠損値処理 9. 6.クロンバックのα係数関連の大きさの予測 3. 共: 標本サイズの適切性 10. KR-20 7. 4. 他の尺度の記述合計点の分布 11. 適合度 Step 1で該当した尺度特性の具体的評価 Box A. 内的一貫性 1. モデル 2. 共: 欠損の割合 3. 共: 欠損値処理 4. 共: 標本サイズの適切性 5. 一次元性 6. 標本サイズの適切性 7. 尺度ごとに統計量の報告 8. 共:重大な研究法の欠陥 9. クロンバックのα係数 10. KR-20 11. 適合度特異的項目尺度特性の具体的評価 8. 5. 他の尺度の尺度特性最低点の回答割合 9. 6. 共:重大な研究法の欠陥最高点の回答割合 10.統計手法の妥当性 7. 下位集団ごとの得点 8. 臨床的有意性 9. 共:重大な研究法の欠陥 Step 3 共通項目 Box F. 仮説検定 1. 共: 欠損の割合 2. 共: 欠損値処理 3. 共: 標本サイズの適切性 4. 事前の仮説設定 5. 関連の方向性の予測 6. 関連の大きさの予測 7. 他の尺度の記述 8. 他の尺度の尺度特性 9. 共:重大な研究法の欠陥 10.統計手法の妥当性 26

27.

使⽤⽬的新定義使い⽅科学的評価 Step 3: 尺度特性の具体的評価 2件法版と4件法版の評価形式尺度特性の具体的評価 Box A. 内的一貫性 1. モデル 2. 共: 欠損の割合 F. 仮説検定 3. Box 共: 欠損値処理欠損の割合 4. 1.共:共: 標本サイズの適切性 5. 2.一次元性共: 欠損値処理 Box J. 解釈可能性 6. 3.標本サイズの適切性共: 標本サイズの適切性 7. 4.尺度ごとに統計量の報告 1. 共: 欠損の割合事前の仮説設定 8. 5.共:重大な研究法の欠陥関連の方向性の予測 2. 共: 欠損値処理 9. 6.クロンバックのα係数関連の大きさの予測 3. 共: 標本サイズの適切性 10. KR-20 7. 4. 他の尺度の記述合計点の分布 11. 適合度 8. 5. 他の尺度の尺度特性最低点の回答割合 9. 6. 共:重大な研究法の欠陥最高点の回答割合 10.統計手法の妥当性 7. 下位集団ごとの得点 8. 臨床的有意性 9. 共:重大な研究法の欠陥 Step 3 クロンバックのα係数を求めているか？ (Box A-9) • 2件法版 – はい – いいえ – 該当しない • 4件法版 – excellent: 求めている – good: NA – fair: 項目全体相関だけ求めている – poor: α係数も項目全体相関も求めていない 27

28.

使⽤⽬的新定義使い⽅科学的評価 Step 3: 尺度特性の具体的評価 尺度特性ごとに共通項目を評価尺度特性の具体的評価 Box A. 内的一貫性 1. モデル 2. 共: 欠損の割合 F. 仮説検定 3. Box 共: 欠損値処理欠損の割合 4. 1.共:共: 標本サイズの適切性 5. 2.一次元性共: 欠損値処理 Box J. 解釈可能性 6. 3.標本サイズの適切性共: 標本サイズの適切性 7. 4.尺度ごとに統計量の報告 1. 共: 欠損の割合事前の仮説設定 8. 5.共:重大な研究法の欠陥関連の方向性の予測 2. 共: 欠損値処理 9. 6.クロンバックのα係数関連の大きさの予測 3. 共: 標本サイズの適切性 10. KR-20 7. 4. 他の尺度の記述合計点の分布 11. 適合度 8. 5. 他の尺度の尺度特性最低点の回答割合 9. 6. 共:重大な研究法の欠陥最高点の回答割合 10.統計手法の妥当性 7. 下位集団ごとの得点 8. 臨床的有意性 9. 共:重大な研究法の欠陥 Step 3 1. 項目の欠損の割合は報告されているか？ • 尺度ごとの欠損値数の平均 • 項目ごとの欠損値の割合 2. 欠損値の処理法は報告されているか？ 3. 標本サイズは十分か？ 4. その他の重大な研究法の欠陥はあるか？ 28

29.

使⽤⽬的新定義使い⽅科学的評価 Step 3: 尺度特性の具体的評価尺度特性の具体的評価 Box A. 内的一貫性 1. モデル 2. 共: 欠損の割合 F. 仮説検定 3. Box 共: 欠損値処理欠損の割合 4. 1.共:共: 標本サイズの適切性 5. 2.一次元性共: 欠損値処理 Box J. 解釈可能性 6. 3.標本サイズの適切性共: 標本サイズの適切性 7. 4.尺度ごとに統計量の報告 1. 共: 欠損の割合事前の仮説設定 8. 5.共:重大な研究法の欠陥関連の方向性の予測 2. 共: 欠損値処理 9. 6.クロンバックのα係数関連の大きさの予測 3. 共: 標本サイズの適切性 10. KR-20 7. 4. 他の尺度の記述合計点の分布 11. 適合度 8. 5. 他の尺度の尺度特性最低点の回答割合 9. 6. 共:重大な研究法の欠陥最高点の回答割合 10.統計手法の妥当性 7. 下位集団ごとの得点 事例 8. 臨床的有意性 9. 共:重大な研究法の欠陥 Step 3 結果の節 (欠損値の割合) » SF-36: Few individual items were missing. At the baseline measurement, 7 items of 101 patients × 36 items = 0.2% were missing. A total score could be calculated for all subjects for all subscales. 項目の内容 Thorborg K et al: Br J Sports Med. 2011 May;45(6):478-91. 項目ごとの欠損値数 29

30.

使⽤⽬的新定義使い⽅ Step 3: 尺度特性の具体的評価 事例科学的評価尺度特性の具体的評価 Box A. 内的一貫性 1. モデル 2. 共: 欠損の割合 F. 仮説検定 3. Box 共: 欠損値処理欠損の割合 4. 1.共:共: 標本サイズの適切性 5. 2.一次元性共: 欠損値処理 Box J. 解釈可能性 6. 3.標本サイズの適切性共: 標本サイズの適切性 7. 4.尺度ごとに統計量の報告 1. 共: 欠損の割合事前の仮説設定 8. 5.共:重大な研究法の欠陥関連の方向性の予測 2. 共: 欠損値処理 9. 6.クロンバックのα係数関連の大きさの予測 3. 共: 標本サイズの適切性 10. KR-20 7. 4. 他の尺度の記述合計点の分布 11. 適合度 8. 5. 他の尺度の尺度特性最低点の回答割合 9. 6. 共:重大な研究法の欠陥最高点の回答割合 10.統計手法の妥当性 7. 下位集団ごとの得点 8. 臨床的有意性 9. 共:重大な研究法の欠陥 Step 3 結果の節 (欠損処理法) » The SST [Simple Shoulder Test] consists of 12 questions with dichotomous response options. For each question, the patient indicates whether he or she is able to do the activity or not. The scores are summarized into a total score, which ranges from 0 (worst) to 12 (best) for shoulder functioning. Missing data were treated as follows: 1 or 2 missing values were substituted with the average value for the other items. If more than 2 items were missing, the response to this questionnaire was considered invalid and no total score was calculated. van Kampen DA et al: J Shoulder Elbow Surg. 2012 Jun;21(6):808-14. 30

31.

使⽤⽬的新定義使い⽅ Step 4: 一般化可能性の評価 Box generalisabilityの評価科学的評価一般化可能性の評価 Box generalisability 1. 2. 3. 4. 5. 6. 7. 8. 年齢性別疾患と治療セッティング国言語標本抽出法欠損値と回収率 Step 4 1. 年齢の代表値と散布度の記述 • 例: 平均値/中央値，標準偏差/範囲 2. 性別の分布の記述 3. 疾患と治療の記述 • 例: 重症度，状態，罹病期間 4. 研究実施のセッティングの記述 • 地域住民，プライマリケア，病院 31

32.

使⽤⽬的新定義使い⽅ Step 4: 一般化可能性の評価 Box generalisabilityの評価科学的評価一般化可能性の評価 Box generalisability 1. 2. 3. 4. 5. 6. 7. 8. 年齢性別疾患と治療セッティング国言語標本抽出法欠損値と回収率 Step 4 5. 研究実施の国の記述 6. 尺度の言語の記述 7. 標本抽出法の記述 • 例: 簡易抽出，連続抽出，無作為抽出 8. 欠損値や回収率の割合の許容性 32

33.

使⽤⽬的新定義使い⽅科学的評価 Step 4: 一般化可能性の評価一般化可能性の評価 Box generalisability 1. 2. 3. 4. 5. 6. 7. 8. 年齢性別疾患と治療セッティング国言語標本抽出法欠損値と回収率 事例 Step 4 方法の節 (国/標本抽出法/セッティング) » Second, we assessed the measurement properties (reliability, validity) in the Dutch population. Institutional approval was waived by our local ethical committee, and written signed informed consent was obtained from all participants. A prospective cohort of patients was recruited consecutively between February 2009 and October 2010 at the orthopedic outpatient clinic of the Onze Lieve Vrouwe Gasthuis, Amsterdam, The Netherlands, by 1 orthopedic surgeon (W.J.W.). Inclusion criteria were age of 16 years or older and the presence of shoulder problems as diagnosed by the orthopedic surgeon (W.J.W.). van Kampen DA et al: J Shoulder Elbow Surg. 2012 Jun;21(6):808-14. 33

34.

使⽤⽬的新定義使い⽅ Step 4: 一般化可能性の評価 事例科学的評価一般化可能性の評価 Box generalisability 1. 2. 3. 4. 5. 6. 7. 8. 年齢性別疾患と治療セッティング国言語標本抽出法欠損値と回収率 Step 4 結果の節 (年齢/性別/疾患の特徴) van Kampen DA et al: J Shoulder Elbow Surg. 2012 Jun;21(6):808-14. 34

35.

構成 使用目的 (6 min) 信頼性と妥当性の新定義 (3 min) チェックリストの使い方 (9 min) チェックリストの科学的評価 (2 min) 35

36.

使⽤⽬的新定義使い⽅科学的評価作成過程プロトコル論文の公開[1](2006.1.24) 「尺度特性の系統的展望」の系統的展望[1] 「尺度特性の方法論の教科書」の系統的展望[1] デルファイ法による43名の専門家の合意形成[2] (2006.3-2007.11) 88名の評定者による評定者一致率調査[3] [1] Mokkink LB et al: BMC Med Res Methodol. 2006 Jan 24;6:2 [2] Mokkink LB et al: Qual Life Res. 2010 May;19(4):539-49 [3] Mokkink LB et al: BMC Med Res Methodol. 2010 Sep 22;10:82 36

37.

使⽤⽬的新定義使い⽅科学的評価作成過程教科書の公開[1] (2011.8.11) マニュアルの公開[2] (2012.1) [1] de Vet et al: Measurement in Medicine: A Practical Guide. Cambridge University Press [2] Mokkink LB et al: http://www.cosmin.nl/images/upload/File/COSMIN%20checklist%20manual%20v9.pdf 37

http://www.cosmin.nl/images/upload/File/COSMIN checklist manual v9.pdf

38.

使⽤⽬的新定義使い⽅科学的評価系統的展望での活用 38

39.

使⽤⽬的新定義使い⽅科学的評価系統的展望での活用  A Systematic Review of the Clinimetric Properties of Habitual Physical Activity Measures in Young Children with a Motor Disability (Int J Pediatr. in press)  Self-management: a systematic review of outcome measures adopted in selfmanagement interventions for stroke (Disabil Rehabil. in press)  Systematic Review of the Clinimetric Properties of Laboratory- and Field-Based Aerobic and Anaerobic Fitness Measures in Children With Cerebral Palsy (Arch Phys Med Rehabil. 2013 Feb;94(2):287-301)  Quality of life among breast cancer patients with lymphedema: a systematic review of patient-reported outcome instruments and outcomes (J Cancer Surviv. 2013 Mar;7(1):83-92)  Measurement properties of performance-based measures to assess physical function in hip and knee osteoarthritis: a systematic review (Osteoarthritis Cartilage. 2012 Dec;20(12):1548-62)  Psychometric properties of the Pain Attitudes and Beliefs Scale for Physiotherapists: A systematic review (Man Ther. 2012 Jun;17(3):213-8)  Clinimetrics of measures of oropharyngeal dysphagia for preschool children with cerebral palsy and neurodevelopmental disabilities: a systematic review (Dev Med Child Neurol. 2012 Sep;54(9):784-95) 39

40.

使⽤⽬的新定義使い⽅科学的評価尺度研究での活用 40

41.

まとめ 文献レビュー，計画・投稿，査読で使用可能 尺度特性に関する4領域の新定義 (信頼性，妥当性，反応性，解釈可能性) 評価形式は4ステップ12ボックス (尺度特性の検討の有無の確認，項目反応理論の評価，尺度特性の具体的評価，一般化可能性の評価) 妥当な作成過程と普及 41

COSMINチェックリストの 概要と共通項目の理解

奥村 泰之