NDBデータの利用経験: サンプリングデータセットを中心に

14.8K Views

September 14, 24

スライド概要

profile-image

一般社団法人臨床疫学研究推進機構

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

NDBデータの利用経験: サンプリング データセットを中心に 奥村泰之 一般社団法人臨床疫学研究推進機構 代表理事 第7回NDBユーザー会 2023/9/14 (土) 15:15~17:15 東京大学 NDBの様々な提供形式における経験談

2.

目次 ◼サンプリングデータセットの概要 ◼初回申出の苦労 ◼普及に向けた試み 2

3.

略歴 専門 臨床疫学 非薬物療法の臨床試験 大規模医療データベースを活用した臨床疫学研究 最終学歴 2009年 日本大学大学院 博士 (心理学) 職歴 国立保健医療科学院,日本医科大学,国立精神・神経医療研究セン ター,医療経済研究機構,東京都医学研究所を経て現職 現職 一般社団法人臨床疫学研究推進機構 代表理事 受賞歴 PCN Reviewer Awards 2021, 2022, 2023 2019年 日本疫学会奨励賞 第4回「藤田賞」精神保健統計分野 第11回「臨床精神薬理」誌賞 最優秀論文賞 第9回「臨床精神薬理」誌賞 優秀論文賞 NDB利用実績 査読付き論文12編 3

4.

NDB・介護DBの申出経験数(新規申出ベース) 4

5.

NDB特別抽出のハードル ◼煩雑な申出手続き ◼膨大な初期費用 ◼柔軟性を欠く手数料 ◼膨大なデータ提供までの時間 ◼膨大な技能習得の階段 ◼利用規定違反に伴うリスク 5

6.

NDB+介護DB連結解析のハードル ◼申出負荷はNDB単独の倍以上 ◼情報公開の不足 (要介護認定情報が歯抜けに なってることは重大) ◼ノウハウの共有不足 ◼ID4の怪しさ ◼ID5の難解さ ◼公表物確認の待機期間 6

7.

入門はサンプリングデータセットを推奨 NDBの利用を検討している方へのマニュアル (https://www.mhlw.go.jp/content/12400000/001074007.pdf) 7

8.

層別抽出法による代表性のある単月デー タセット NDBの利用を検討している方へのマニュアル (https://www.mhlw.go.jp/content/12400000/001074007.pdf) 8

9.

層別抽出法は標本抽出理論により代表性 が担保される レセプト種別 (医科入院/医科入院外/DPC/調剤) × 性別 (男女) × 年齢 (0~9各歳,10~100歳[5歳ごと],100歳以上) WallStreetMojo (https://www.wallstreetmojo.com/stratified-sampling/) 10%抽出 OR 1%抽出 9

10.

特別抽出 vs サンプリングデータセットの ハードルの比較 特徴 特別抽出 サンプリングデータセット 審査の厳しさ 厳しい場合もある 易しい セキュリティルームの整備 必要 不要 倫理審査の承認注 必要 不要 データ入手までの期間 承認後1年ほど 承認後すぐ 情報機器等の費用 200~300万円 30~100万円 データ抽出手数料 50~150万円 30~50万円 データハンドリングのハードル 困難 少し難しい 公表制限 あり なし 注. NDBの規定上という意味であり,倫理審査委員会の内部規程に依存する。 10

11.

特別抽出 vs サンプリングデータセットの データ構造の比較 特徴 特別抽出 サンプリングデータセット 点数表区分 医科・DPC・調剤・歯科 医科・DPC・調剤 診療月 通年 単月 患者の追跡性 ○ ✕ 公費単独 ○ ✕ 匿名医療機関コード ○ ✕ 都道府県コード ○ ✕ 高額レセプト・出現 頻度の低いコード ○ ✕ 介護DB等との連結 ○ ✕ 11

12.

サンプリングデータセットの提供期間 直近の経験では待機期間は約6か月 その他は約3か月 提供申出者 国立精神・神経医療 医療経済研究機構 臨床疫学研究推進機構 研究センター 申出日 2012年5月14日 2017年6月30日 2021年10月8日 (変更: 2024年4月26日) 承諾通知日 2012年7月12日 2017年9月8日 2022年1月12日 (変更: 2024年7月8日) 手数料決定日 NA NA 2022年7月13日 (変更: 2024年7月25日) データ提供日 2012年10月20日 2017年11月20日 2022年7月25日 (変更: 未定) 手数料 NA NA 375,797円 (変更: 442,246円) 12

13.

研究テーマの設定例 ◼診療の質の評価 ◼急性疾患の発症率の推計 ◼薬剤の年間処方量の推計 ◼診療報酬改定前後の診療の質の変化 13

14.

研究成果一覧① 主著者 奥村泰之 關真美 飯原なおみ 木村通男 荒川亮介 Naomi Iihara 佐藤悠子 Hiromi Hagiwara 標題 雑誌名 IF 日本全国の統合失調症患者への抗精神病薬の処方パターン: ナ 臨床精神薬理 NA ショナルデータベースの活用 サンプリングデータセットを用いた併用禁止医薬品等の処方実 医療情報学 NA 態研究 わが国のナショナルレセプトデータベースが示した運転等禁 医療薬学 NA 止・注意医薬品の使用実態 レセプト情報データベースを用いた調査: 紹介時同月内異施設同 医療情報学 NA 一検査実施状況 ナショナルデータベースを用いた外来診療における抗不安薬・ 臨床精神医学 NA 睡眠薬の処方実態の検討 Polypharmacy of medications and fall-related fractures in older J Clin Pharm 2.51 people in Japan: a comparison between driving-prohibited and Ther driving-cautioned medications [日本の高齢者における薬物療法 と転倒骨折のポリファーマシー:運転禁止薬と運転注意薬の比 較] ナショナルデータベースを用いた,がん患者の死亡2週間前の Palliat Care Res NA 終末期医療の質の評価: サンプリングデータセットの活用とその 限界 The survey of the compliance situation to the antihypertensive Yakugaku therapy guideline by analyzing Japanese National Claims Data [ Zasshi ナショナルデータベースの分析による降圧療法ガイドラインの 遵守状況の調査] NDBを活用した査読付き論文リスト (https://icer.tokyo/materials/ndb_references/) 0.30 14

15.

研究成果一覧② 主著者 Mai Sato 標題 雑誌名 IF Nationwide survey of severe postpartum hemorrhage in Japan: J Matern Fetal 2.40 an exploratory study using the national database of health Neonatal Med 日本における分娩後異常出血の全国調査:全国 insurance claims [ 健康保険請求データベースを用いた探索的研究] Hidetoshi Igari A retrospective observational study of antimicrobial treatment J Infect for non-tuberculous mycobacteria disease using a nationwide Chemother 全国の保険金請求データベースを用い claims database in Japan [ た非結核性マイコバクテリア疾患に対する抗菌薬治療のレトロ スペクティブ観察研究] 2.21 Hidetoshi Igari Epidemiology and treatment outcome of pneumonia: analysis J Infect based on Japan national database [肺炎の疫学と治療アウトカム: Chemother 日本のナショナルデータベースに基づく分析] 2.21 Hidetoshi Igari A retrospective observational study of antibiotics treatment for J Infect sepsis using a nationwide claim database in Japan [ 日本における Chemother 敗血症に対する抗菌薬処方のナショナルレセプトデータベース を用いた後ろ向き観察研究] 2.21 Ai Kido 2.69 Nationwide incidence of central retinal artery occlusion in Japan: BMJ Open an exploratory descriptive study using the National Database of Health Insurance Claims (2011-2015) [日本における網膜中心動脈 閉塞症の全国発生率:全国健康保険請求データベース(2011~ 2015年)を用いた探索的記述的研究] NDBを活用した査読付き論文リスト (https://icer.tokyo/materials/ndb_references/) 15

16.

研究成果一覧③ 主著者 Yamazaki Shingo 標題 雑誌名 Antibiotics prescriptions for pneumonia analyzed by claim Int J Clin information in Japan [日本のレセプト情報の分析による肺炎に対 Pharmacol する抗菌薬処方] Ther IF 0.98 Taisuke Yatomi Prescription patterns of psychotropics in patients receiving Acta Psychiatr 6.39 synthetic glucocorticoids [ 合成グルココルチコイド投与中の患者 Scand における向精神薬の処方パターン] Atsushi Mizuno Differences in aggressive treatments during the actively dying Heart Vessels 1.81 phase in patients with cancer and heart disease: An exploratory study using the sampling dataset the National Database of Health Insurance Claims [がんと心疾患患者の終末期における積 極的治療の差: NDBサンプリングデータセットを用いた探索的研 究] Misuzu Yahaba Antibiotics for hospitalized children with community-acquired J Infect 2.21 pneumonia in Japan: Analysis based on Japanese national Chemother database [日本における市中肺炎により入院した子供への抗菌薬 処方] 竹下康平 NDBサンプリングデータセットを利用した急性期脳梗塞の入院 脳卒中 期間に関連する因子の研究 NDBを活用した査読付き論文リスト (https://icer.tokyo/materials/ndb_references/) NA 16

17.

研究成果一覧④ 主著者 標題 雑誌名 IF Shin Kuramochi Drug combinations for mood disorders and physical comorbidities that Pharmacopsychi 2.54 need attention: A cross-sectional national database survey [気分障害 atry と身体疾患における注意が必要な併用療法: 全国データベースに よる横断的調査] Tami Sengoku 下川 尚子 Noriko Tsuji Prevalence of type 2 diabetes by age, sex and geographical area J Epidemiol among two million public assistance recipients in Japan: A crossCommunity sectional study using a nationally representative claims database [日 Health 本の生活保護受給者200万人における2型糖尿病の年齢・性・地 域別有病率: 全国代表的レセプトデータベースを用いた横断的研 究] National Databaseオープンデータおよび外来サンプリングデータ 脳と発達 解析で明らかにする本邦の小児鎮静MRI検査の実態 6.29 Trend of anticoagulant therapy in elderly patients with atrial Sci Rep fibrillation considering risks of cerebral infarction and bleeding [高齢 の心房細動患者における脳梗塞および出血のリスクを考慮した 抗凝固療法の変化] 5.00 NDBを活用した査読付き論文リスト (https://icer.tokyo/materials/ndb_references/) NA 17

18.

NDBサンプリングデータセット の利用経験: 初回申出の苦労 18

19.

初めてのNDB 向精神薬の処方パタンの探索的分析 匿名医療保険等関連情報の第三者提供の現状について (報告) (https://www.mhlw.go.jp/content/12400000/001262623.pdf) 19

20.

研究に至る経緯 学位取得 2009 2010 2011 2012 DPCデータを活用した 研究開始 特別抽出利用申出 サンプリングデータ セット利用申出 20

21.

タイムライン 201204 利用申出 08 データ受領 12 201304 論文投稿 論文受理 08 21

22.

利用申出の目的 ◼ナショナルデータベースを活用し て,向精神薬の処方パタンを探索的 に検討することを目的とする。 22

23.

運用フロー図 23

24.

個室整備 24

25.

端末 ◼モデル ◆DELL Precision T7500 ◼CPU (6コア) ◆Intel® Xeon® Processor E5645 ◼メモリ ◆24GB ◼OS ◆Windows 7 Professional 25

26.

記録媒体 ◼BUFFALO RAID1対応 USB3.0用 外付け ハードディスク 2ドライブモデル 4TB HD-WL4TU3/R1J 26

27.

ソフトウェアとパッケージ ◼ソフトウェア ◆データ解析環境R x64 2.15 ◼パッケージ ◆XLConnect ◆snowfall 27

28.

データベースの構造把握 サンプリングデータセットの使用経験 (https://www.mhlw.go.jp/stf/shingi/2r9852000002ss9z-att/2r9852000002sse8.pdf) 28

29.

データの確認 29

30.

ファイルの確認 30

31.

データレイアウトシートの作成 列番号 ソフトウェア上の 変数名 利用する変数 変数の意味 データの型 コードの意味 31

32.

ファイル一覧表の作成 ファイル名 レコード種別 行列サイズ 利用項目 1_IR.csv 医療機関情報レコード 130801*12 なし 1_RE.csv レセプト共通レコード 130801*38 氏名、男女区分、生年月日、病棟区分 1_HO.csv 保険者レコード 1_KO.csv 公費レコード 1_SY.csv 傷病名レコード 1_SI.csv 診療行為レコード 1_IY.csv 医薬品レコード 1_TO.csv 特定機材レコード 1_CO.csv コメントレコード 251795*50 なし 1564295*7 なし 1_NI.csv 日計表レコード 33337*34 なし 1_SJ.csv 症状詳記レコード 128618*5 なし 130801*17 診療実日数、合計点数 22352*14 診療実日数、合計点数 1484571*10 傷病名コード、診療開始日、主傷病 診療行為コード、数量データ、点数、 4980164*46 回数 1961452*46 医薬品コード、使用量、点数、回数 32

33.

統合REテーブルの作成 ◼入院-外来-DPC-調剤の統合 区分 ID 1 男女区分 年齢区分 2 7 2 3 2 1 7 1 4 5 1 2 11 11 DPC DPC 6 7 8 2 1 1 14 15 14 DPC 調剤 9 10 1 1 13 4 調剤 調剤 11 12 1 1 2 13 医科入院 医科入院 医科入院 医科外来 医科外来 医科外来 33

34.

統合SY-SBテーブルの作成 ◼入院-外来-DPCの統合 区分 ID 傷病名コード 主傷病 医科入院 1 2809009 医科入院 1 8841290 医科入院 1 8840042 医科外来 2 8833421 医科外来 2 医科外来 3 8841393 DPC 4 8838585 DPC 4 6441002 DPC 4 6563004 01 01 01 34

35.

統合IY/SI-CDテーブルの作成 ◼入院-外来-DPC-[調剤]の統合 区分 ID 医薬品コード 回数 使用量 医科入院 1 620491801 7 1 医科入院 1 620491801 2 0.5 医科入院 1 643310473 2 医科外来 2 610421335 2 医科外来 2 620004575 2 医科外来 2 620459001 56 1.34 DPC 3 620004798 1 5 DPC 3 661310146 1 5 調剤 4 620452801 3 14 調剤 4 613130595 3 14 35

36.

データ全体の記述 患者背景 変数 レセプト区分 医科外来 医科入院 DPC 性別 男性 女性 年齢 0-9歳 10-19歳 20-29歳 30-39歳 40-49歳 50-59歳 60-69歳 70-79歳 >= 80歳 N = 979,756 人数 % 755,247 130,801 93,708 77.1 13.4 9.6 431,386 548,370 44.0 56.0 88,131 44,582 48,055 73,437 78,215 100,586 174,523 203,970 168,257 9.0 4.6 4.9 7.5 8.0 10.3 17.8 20.8 17.2 36

37.

データ全体の記述 精神科関連病名 変数 1. いずれかの精神疾患 2. うつ病性障害 3. 双極性障害 4. 統合失調症 5. アルコール使用障害 6. 物質使用障害 7. 不安障害 8. 摂食障害 9. 広汎性発達障害 10. 行為障害 11. 知的障害 12. その他 主傷病 人数 % 52,575 13,228 3,024 22,119 1,467 64 4,910 496 900 217 845 7,469 主傷病/副傷病 人数 % 5.4 1.4 0.3 2.3 0.2 0.0 0.5 0.1 0.1 0.0 0.1 0.8 145,719 47,407 8,341 42,576 2,626 208 36,269 4,950 1,891 614 2,275 45,030 14.9 4.8 0.9 4.3 0.3 0.0 3.7 0.5 0.2 0.1 0.2 4.6 N = 979,756 37

38.

同僚との相談 統合失調症が結構多いから「抗精神病薬の多 剤処方の記述」はテーマとして面白いかも 38

39.

同僚との相談 ✓ 精神病床入院は薬剤料の包括があるので注意 ✓ 精神科外来は通院・在宅精神療法を取るもの ✓ 主傷病で蓋然性が高まるかも ✓ 抗精神病薬の無処方は想定し難い 39

40.

包括病棟と出来高病棟の記述 全患者 (N = 979,756) ・外来 (n = 755,247) 入院 (n = 224,509) ・精神科以外 (n = 198,232) 精神科包括病棟 (n = 12,805) 精神科出来高病棟 (n = 13,472) ・統合失調症なし (n = 6,020) ・統合失調症なし (n = 5,650) 統合失調症 (主傷病) (n = 6,785) 統合失調症 (主傷病) (n = 7,822) ・非定型抗精神病薬加算なし (n = 2,374) ・定型抗精神病薬のみ (n = 1,026) ・抗精神病薬なし (n = 431) 非定型抗精神病薬加算 (n = 4,411) 非定型抗精神病薬あり (n = 6,365) 40

41.

抗精神病薬が2種類以下の割合 41

42.

入院と外来の記述 全患者 (N = 979,756) ・精神科出来高病棟以外の入院 (n = 211,037) 精神科出来高病棟 (n = 13,472) 外来 (n = 755,247) ・統合失調症なし(n = 748,165) ・通院精神療法のない統合失調症 (n = 828) ・統合失調症なし (n = 5,650) 統合失調症 (主傷病) (n = 7,822) 通院精神療法 + 統合失調症 (主傷病) (n = 6,254) ・抗精神病薬なし (n = 431) ・抗精神病薬なし (n = 544) 抗精神病薬あり (n = 7,391) 抗精神病薬あり (n = 5,710) 42

43.

抗精神病薬が3種類以上の割合 43

44.

論文受理 44

45.

研究成果の影響 朝日新聞 (2013/8/20朝刊) 臨床精神薬理誌 優秀論文賞 平成26年度診療報酬改定 45

46.

研究遂行の課題 ◼データハンドリング開発の無駄 ◼全データの記述からリサーチ・クエ スチョンを精査する無駄 46

47.

NDBサンプリングデータセット の利用経験: 普及に向けた試み 47

48.

ハードル激減への試み ◼標準データセットの作成 ◼網羅的解析による基礎資料の公表 48

49.

昨年度の発表 SQLiteを使ったNDB サンプリングデータ セット標準データセット作成の試み 奥村泰之 一般社団法人臨床疫学研究推進機構 代表理事 第6回NDBユーザー会 2023/9/15 (金) 15:20~16:00 日本科学未来館 未来館ホール 自由集会 NDB 分析して困ったこと、できたこと等 SQLiteを使ったNDB サンプリングデータセット標準データセット作成の試み (https://www.docswell.com/s/icer/KYWGNV-2023-10-07-095629) 49

50.

SQLプログラム使用のイメージ 元データ 命令 データベース 整然化 50

51.

前提条件 ① 各自が,NDB利用申出をする ② 各自が,スタンドアローンの環境で,端 末とストレージを整備する ③ 各自が,SQLiteとRをインストールする ④ Rプログラムが共有される ⑤ 各自が,Rプログラムを実行する 51

52.

開発環境 あえて貧弱な環境を設定 ワークステーション Dell Mobile Precision Workstation 3551 CPU 6コア/2.7GHz メモリ 64GB (32GBでも稼働) ストレージケース STARDOM SR2-B31 ストレージ Micron MTFDDAK1T9TDS-1AW1ZABYY 1.92TB SSD 5300×2 52

53.

SQLiteはファイルを設置するだけ SQLite: https://sqlite.org/index.html 53

54.

2つのRプログラムで整然化 複数月のファイルを1 つのテーブルに格納 複数のテーブルを整 理・統合 54

55.

元のcsvファイル,2178ファイル181GB 2012年1月~2020年1月診療分 5.72GB/66ファイル/診療月 55

56.

整然化済みのDB,サイズは565GB 56

57.

テーブル構成と情報源 名称 説明 情報源 統合REテーブル 患者背景テーブル RE,HO,BU 統合IYテーブル 医薬品テーブル IY,CZ,SH,CD CDとIYの重複分は除外 統合SIテーブル 診療行為テーブル SI,CD,SK CDとSIの重複分は除外 統合SYテーブル 傷病名テーブル SY,SB 57

58.

標準データセット作成のSQLプログラム を活用した論文例 Ishizuka K: Asian J Psychiatr. 2024 Feb 7:94:103961. doi: 10.1016/j.ajp.2024.103961. Ishizuka K: Psychiatry and Clinical Neurosciences Reports. doi: 10.1002/pcn5.147 58

59.

ユーザーの声① ◼手始めに3回分のサンプリングデータ セットを申請し,ターミナルでコマ ンドを打ってなんとかしようとして いました。が,なんともなりません でした。 ◼こんなに簡潔に処理できると知って いれば全期間のデータセットを申請 したかったです。 59

60.

ユーザーの声② ◼分割された状態で提供されるNDBサ ンプリングデータセットを統合RE テーブル、統合SIテーブル、統合SY テーブル、統合IYテーブルに成型する プログラムは本当に助かりました ◼講義、研究指導、研究科運営の合間 を縫って進めることを考えると、数 カ月~1年の時間の節約になったと感 じています。 60

61.

網羅的解析による基礎資料の公開 臨床疫学研究推進機構: https://icer.tokyo/materials /ndb_feasibility_check/ 61

62.

薬剤,診療行為,傷病名の網羅的解析 62

63.

薬剤クラスごとの分析 ◼ 外来/入院の処方 ◼ 年齢区分別・外来/入院の処方 ◼ 外来/入院の上位 30 傷病 ◼ 年齢区分別・外来/入院の上位 15 傷病 ◼ 主たる適応症の診療期間別・外来の処方 63

64.

外来における抗不安・睡眠薬トップ10の 推移 64

65.

診療行為ごとの分析 ◼ 外来/入院の上位 200 傷病名 ◼ 区分番号別の外来/入院患者数 ◼ 年齢・区分番号別の外来/入院患者数 ◼ 区分番号別・外来/入院の上位 50 傷病名 ◼ 年齢・区分番号別・外来/入院の上位 30 傷病名 65

66.

精神科専門療法,外来患者数の推移 66

67.

網羅的解析を活用した論文例 67

68.

サンプリングデータセットの事務的課題 ◼利用申出における研究目的等の記述の必 要性は疑問 ◼匿名化ルールは,少し緩めて欲しい ◼支払い方法は銀行振込に変えて欲しい ◼データ提供までの期間が無駄に長い ◼公表物確認の必要性は疑問 68

69.

Take-home Messages ◼NDBサンプリングデータセット利活 用に向けたハードルを激減できた ◼特別抽出で頓死する前に,気軽に チャレンジして欲しい ◼零細企業が赤字垂れ流しで持続する のは厳しいので支援があると嬉しい 69