>100 Views
May 24, 26
スライド概要
https://www.seagaia.org/sgm2026/
seagaia-meeting (宮崎シーガイア・コンベンションセンター)
多施設共同研究におけるデータ連携では、臨床検査項目の違いがビッグデータ構築の障壁となっており、専門家による手動マッピングも膨大な労力を要し実質的に困難でした。しかし、「千年カルテ」の実データを活用することで、臨床検査項目の半自動マッピング技術の開発に成功し、従来の手動作業に対して最大2700倍の高効率化という技術的ブレークスルーを達成しました。この成果を受け、株式会社ハイスマートが本技術を事業化しました。システムと臨床検査技師の連携により、プロレベルのマッピング結果を従来よりも安価に提供できる体制が整ったことを報告します。
医療情報関連のスライド共有.
2026.05.23 宮崎 Seagaia コンベンションセンター SEAGAIA MEETING 2026 (2日目) 共通検査マスタ生成サービスの事業化 粂 直人, 博士(情報学) 広島大学病院 医療情報部 特定教授 株式会社ハイスマート 代表取締役
背景 生成AI時代に向けたビッグデータ分析の手前の課題 多施設共同研究の課題 様々なプロジェクトでの律速段階 大規模データベース構築の課題 項目マッピング 病名 処方 意外と難しい 臨床検査項目 結構難しい 臨中ネット 施設ごとのJLAC10,JLAC11へのマッピング すべての項目は無理 アップデートできている施設は 1/20 現在の対象項目は 43項目 → 目標200項目 MID-NET 値の評価・補正 現在の対象項目 127項目 千年カルテ AMEDプロジェクト内で◯千万円単位で実施. マスターベースマッピングだと受領した実績データとずれる. 更新版マスター受領運用は事実上困難 個別共同研究 検査項目マッピングが可能な人材の確保が困難
HIGHSMART社:臨床検査項目の実務的マッピングに成功 お客様 弊社 マッピングしたい施設数 対象項目一覧 査定 受託 実績データ出力依頼 実績データ準備 (過去2年分程度) データ受領 データアクセス 仮名加工データ 共通検査マスタ取得 データ出力支援 半自動マッピング 共通検査マスタ 臨床検査技師の validation
背景 臨床検査項目の多施設間のマッピング,標準コードへのマッピングは,人的負荷の塊 担当者が居ない,(臨中 9/15) 組み合わせ確認が多過ぎて実質マッピングできない,(臨中 11/15) 一度マッピングしても新規項目が発生した時点で更新が必要になるが人的負荷が高く継続的には実施できない (臨中 13/15) M1 x M2 x M3 x 平均 3000項目/1施設 共通 M 標準コード(JLAC10,JLAC11, LOINC)へのマッピング完遂,マッピングの維持は困難 研究課題ごとにマッピングニーズ(要求粒度)が異なるとしても,対応困難 → マスターだけでマッピングした→失敗.結果値と紐付けられない → 情報が少なすぎて,結果値と紐づくマスター整備がそもそもできない → 実データが必要
開発過程の紹介 千年カルテの実績データの利用 ◼ 106病院のデータセット ◼ 認定事業者LDI社から匿名加工データを購入 31病院の検査結果実績データを取得
受領データ 基本統計量 総数,平均,中央値 SD,25%区間, 75%区間 最大値,最小値 度数分布 K=11 で十分
“HBA1C” の標準的な表現系 (NGSP, JDS) 日本語(6)だけの課題なのか?(アルファベット,ひらがな,カタカナ,漢字,2バイト,1バイト) 例:31病院の表記揺れ
結果 11ターゲット検査項目で検証 PIRは非常に高い.MSRも十分高い 院内コード総数 (TLC) 施設平均コード数 → 実用化 :69,654 : 3,258 (院内コード総数) (病院数) TLC = Total in-house codes NHP = Number of Hospitals, (真陽性数) NTP = Number of True Positive, (正答数) NCT = Number of Correct Target, (検出数) NoD = Number of Detection, (シグナル/ノイズ比) S/N = Signal/Noise Ratio, (平均成功率) (生産性改善率) MSR = Mean Success Rate, PIR = Productivity Improvement Ratio. Table 2. Performance Metrics for Laboratory Test Code Mapping 現在◯◯項目に 対応し, 平均PIR=330程度
PIR (PERFORMANCE IMPROVEMENT RATE) 生産性改善率 定義 機械学習モデルによるマッピングと,手動マッピングの作業効率比 値が高いほど,機械学習モデルによる作業効率が高いことを示す • TLC: 全病院の検査項目総数 • NoD: 機械学習モデルで特定できた共通 項目に紐づく項目候補数 • NCT: 正確に分類できた項目数 • NTP: “真”の正解項目数.(未知) Ground Truth (27-23) で拾えなかった 4 項目は,諦める 追跡コストが全数マッピングと 等価なため PIR = 0.0004 / 0.2771 = 714.9 714.9 倍の効率化 ※このケースではNTP=27
MSR 平均成功率 (MEAN SUCCESS RATE) 定義 手動マッピング前のプレスクリーニングに機械学習モデルを用いた場合の,潜在的なマッピング成功率 複数病院間の特定の検査項目コードのマッピング 最終的な,人(臨床検査技師)の判断を正解(Ground Truth)とする.性能評価のために必要.実務的には不要 TP = true positive FP = false positive FN = false negative モデルに対して: False positiveはOK (うっかりは人がチェックするから)マッピングが成立する. False Negative(見逃し)は NG (人が拾い上げる機会もないから). → → 見逃し(False Negative)を減らすには cut off を下げる. MSRが低ければ cut off を下げるオペになる. false positive は 人が除外するから問題ない False Positive が増えれば人が検証する数は増える.
課題の本質 マッピングは絶対答えがある問題 → 頑張り方が問題 真陽性は頑張れば確実に上がる 偽陽性も頑張れば確実に下る → MSRとPIRのトレードオフを調整 真陽性率 複数病院のマスターデータ程度のデータ量では生成 AIに取り込んで学習するには少なすぎる 生成AIに検査値を全部投入して考えさせるのは今の ところ効率が悪そう(ハルシネーション対応) → 機械学習モデルのほうがフィットする課題 偽陽性率 https://www.tomomi-research.com/archives/2401
手法 半自動マッピング技術と,臨床検査技師の目視確認のワークフロー連携を確立 臨床検査技師がアノテーションを付ける前に,院内検査項目を半自動で分類し同一グループ候補群を生成する機械学 習(ML)モデルを作成 表記揺れ等の辞書データを生成・蓄積しながら,検査項目毎の分類精度を上げる M LIS, EMR EMR マスター 処理 検査結果値 “HbA1c” 完全一致しない ことがほとんど “HbA1c+*” 分類予測に結果値を使用 すべてを数値パラメータ化して評価
機械学習用の入力データ生成 https://www.highsmart.co.jp/?p=426 MEDINFO2025, 台北 入力 Meta Data 項目名 (ローカル名称) 検体名 単位 基準範囲 3. Demographicsで分類 結果 候補 文字 類似度 スコア 数値パラ メータ化 統計値 1. 2年間の全データ 2. Q1—Q4で分類 処理 数値 人の 評価 結 果 確 定 ML 対象 外 対 象 外
ご依頼内容と費用感の関係 施設数/項目数 A B HbA1c ALT AST (更新対応)過去実施分 割安で再受託可能 C (新規施設追加) 割安で再受託可能 Na HBs (新規項目追加) 対応項目数増分ー他のマッピング実績の有無で応相談 (新規施設・新規項目 追加) 手動突合相当の稼働 (従前同様) 千年カルテ当時:マスターマッピング:64項目対応 <◯千万円 ↓ ↓ 10分の1のコスト ↓ ハイスマート社:実績データマッピング + 専門家のチェック:◯◯項目対応(増加中)
今後の課題 千年カルテ未対応の病院からの検査実績値の取得にかかる費用は個別対応で未知 同様のマッピング技術が,薬剤マスターにも適用できそう 生成AIがどこまで追いついてくるか?もう追いつかれているか?もう追い抜かれたか?? 人がマスターを整理する時代の終わり 検査結果の集計すら不要?生データを入れれば評価が完結する世界へ! 今回の個人情報保護法改正で相当LLMでのデータ利活用促進に寄った流れになった → (事業者目線で)“仮名加工認定事業者“が(安全管理措置はとりつつも)データを使いやすい環境になるはず? 高効率なmappingに寄与する,検査結果値データの取得が容易になるか? 個人情報保護法,EHDS, 地域医療確保法 でできることが広がっていく中で,次世代医療基盤法の役割は?!
(補足)その他の事業 BPMによる医療DX BPM (Business Process Management)ツールを用 いた医療DXを支援します. 実績 千年カルテで実績 100施設との契約調整,接続管理をBPMフロー化 事務2名で1000枚/年の書類作成・稟議・承認を実現 広島大学病院での実績 オンコール診療医の電子カルテリモートアクセスの利用 申請・接続設定・入職・離職管理をBPMフロー化 事務員負荷0で,申請から接続完了まで完結可能に. → 2025春 医療情報学会でランチョンセミナー講演 医療情報学会中国四国支部での実績 講演会の受講確認と受講証発行をBPMフロー化 700人分の発行・再発行,受講確認を1週間で完了 → 業務フロー改善のニーズがあればお声がけください https://www.highsmart.co.jp
まとめ 臨床検査項目のマッピングは千年カルテ開始以来の課題だった. 千年カルテで収集した検査実績データを用いて,超高効率なマッピングを実現できた. マッピング対象の施設の検査実績データがあれば,臨床検査技師の最終確認を含めて共通検査項目をグルーピングし て提供するサービスを事業化した. 個別病院間の共通検査項目マッピングはもとより,標準コード(JLAC10,JLAC11,LOINC)へのマッピングも可能である. 今後,生成AIがすべての検査結果データを閲覧して同一項目を同定できるようになるまでは 人の目で正解!を出した結果は当面重宝していただけるのでは?
HTTP://WWW.HIGHSMART.CO.JP/ http://www.highsmart.co.jp/