眼科AI学会 AIコンペティション 8th solutionと上位解法

5.3K Views

December 08, 24

#ai #machine learning #deep learning #ai in medicine #medical artificial intelligence #医療 #学会 #kaggle #AIコンペティション #眼底写真 #メタボリックシンドローム #機械学習 #画像認識

スライド概要

2024/12/01に開催された眼科AI学会でAIのコンペティションに参加した際の自身の解法と上位者のソリューションを共有しております。ラボやコミュニティで共有した内容を一部改変して共有しております。次回も開催されるそうですので興味のある方はぜひ参加してみてください。

Yuki Tashiro

@yuki-tashiro

スライド一覧

初めまして医療AIに興味があります。松尾研究室のDL輪読会やAcademiX Medicalに所属しています。大学の研究室やいくつかのインターン先で、医療系のデータ（テキスト・画像・センサデータ）の解析に関する研究しております。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

【論文紹介】医療LLMsのサーベイ論文：A Survey of Large Language Models in Medicine: Principles, Applications, and Challenges

ai machine learning deep learning ai in medicine medical artificial intelligence 医療医療ai generative ai

Yuki Tashiro 8K

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.6M

Unreal Engine5 Lumenの仕組みと肝心なところ

ue5 ue-rendering ue-lumen

エピックゲームズジャパン 1.3M

Meta XR SDK(V66-74)でQuestアプリを開発

spatial anchor unity quest pro shaperecognizeractivatestate oculus integration transformfeaturestateprovider building blocks transformrecognizeractivestate ovrsemanticclassification jointdeltaprovider ovrscenemanager jointvelocityactivestate オクルージョン sequenceactivestate scene manager ambisonic depth api metaxraudiosource playerlocomotor meta xr sdk quest3 ovrplayercontroller マルチモーダル meta haptics studio direct touch ui meta xr haptics sdk ovrspatialanchor ovrtrackedkeyboard hapticclipplayer fingerfeaturestateprovider hapticclip ワイドモーションモード wmm mruk mr utility kit voice sdk jointrotationactivestate meta horizon os ui set asw application spacewarp ovr metrics tool unityscene manager colocation discovery コロケーション mx ink passthrough camera api hand tracking microgestures webcamtexturemanager passthroughcamerautils cameraviewermanager hand pose selector recorder

あうぜん 1M

UE5レンダリングフロー総おさらい(2024) 基礎編！[CEDEC+KYUSHU 2024]

ue5 unreal engine ue-rendering

エピックゲームズジャパン 1M

各ページのテキスト

眼科AI学会コンペ 24.12.03 眼科AI学会 AI コンペティション th 8 solution と上位解法田代勇希九州大学工学部機械航空工学科生体機能工学研究室 B4 LinkedIn

https://www.linkedin.com/in/yuki-tashiro/

Outline • コンペ概要 • 8th Solution • 解析結果 • データ・予測するもの・開催の背景（目的） • モデル概要図 • t-SNEの解析 • 相関関係 • 機械学習での予測 • データ・精度 • LGBMでの重要度 • 上位 solutions • • • • 特別賞 3位 2位 1位 2

コンペ概要コンテスト概要 • • • • • • 3 タスクテーマ • 『眼底写真を用いたメタボリックシンドローム推定』データ • 収集方法：Japan ocular imaging registry (JOIR)からの健診データ学習データ • • 5000名の眼底画像と臨床情報のテーブルデータテーブルデータ • • 年齢、腹囲、血圧（収縮期、拡張期）、血糖、脂質 (HDLコレステロール, 中性脂肪) メタボの判定結果テストデータ • 500名の画像のみ（臨床情報のテーブルデータなし）共有前の前処理 • 解析や評価の複雑さを減らす目的で、男性に由来するデータのみを提供眼底画像の一例補足 • • • • 期間：2024年9月03日（火）～10月25日（金）の約７週間メタボリックシンドローム（METS, メタボ） Prizes：1位：5万円、2～3位、特別賞：1万円（優れた解析の方）次回も学会コンペ開催予定！（2025.06.27-28, 大阪） • https://2025.asiateleophth.org/ Ref: http://www.jsaio.jp/meeting/soukai/contest/index.html

コンペ概要メタボリックリンドロームの診断基準 4 メタボは腹囲＋特定の2項目が基準値以上で診断 Ref: 厚生労働省生活習慣病予防のための健康情報サイトメタボリックシンドロームの診断基準

https://www.e-healthnet.mhlw.go.jp/information/metabolic/m-01-003.html

Solution 提出したモデル概要図 1. CenterCrop • 2. 不要な背景の切り取り前処理 • 一般的な前処理を採用 3. 特徴量抽出 4. 補助損失 (Auxiliary Loss) 5. 複数モデル結果の加重平均 5

Solution 補助ロス（Auxiliry Loss）について • 補助ロス（Auxiliry Loss）とは • 主損失（メインタスクのLoss）に加えてモデルに対する追加の損失関数 • 利点 • モデルの表現力向上 • 学習データのみにあるメタデータを活用可能 • 詳細 • 主損失：メタボの予測（80％） • 補助損失：収縮期血圧の予測（20％） 6

Solution 補助損失のAblation Study • 年齢で精度向上 • • • 先行研究で年齢を予測するタスクあり →年齢がメタボの予測の補助となった拡張期血圧を20％で追加 • SBPは全体のlossのうち20％ 7 データ（割合） val accuracy なし 0.63 age(0.2) 0.644 SBP(0.2) 0.657 表1：カラム別の補助損失の精度

Solution 補助損失のAblation Study 8 補助損失の割合は探索する必要がある今回は20％が最も精度が良かったデータ（割合） val accuracy age(0.5) 0.634 age(0.2) 0.644 age(0.2), TG(0.2) 0.634 age(0.2), TG(0.1) 0.644 表2：補助損失の重み別の精度

Solution 効かなかった手法 9 • 効かなかった手法 • LabelSmoothing、50epoch、スタッキング、入力チャネルを増やす（グレースケール・ルールベースの血管マスク処理・HSVで6ch）、Pooling （MaxPooling・GEM）、特徴量抽出（GRU・LSTM・BiLSTM・ attention）、warmup、アンサンブル（全ての出力の平均・ブレンディング・スタッキング）、モデル（SwinT, MaxViT, EVA, ConvNeXt）・補助損失でTGの追加。

10.

解析次元削減（t-SNE）による画像データの可視化 10 1200x1200の画像を2次元に次元削減してプロットし、メタボで画像が明確に異なるか検証症例別の可視化年齢別の可視化メタボでは明確な差は見られなかったが年齢では差があり

11.

解析テーブルデータの相関係数 • 相関関係が高いカラム • • 0.76：収縮期血圧と拡張期血圧 0.58：腹囲とメタボのラベル 11

12.

解析機械学習でのメタボの予測 • 学習方法 • • • • 12 train dataの8割機械学習モデル：LGBM Accuracy：0.998 学習したカラム • • • • • • • • • • "age": "検査時年齢", "AC": "腹囲", “SBP”: “収縮期血圧", "DBP": "拡張期血圧", "HDLC": "HDLコレステロール", "TG": "トリグリセライド (中性脂肪)", "BS": "血糖", "METS": "メタボリックシンドロームの有無 (0: なし、1: あり)", "Component 1": "t-SNE 主成分1", "Component 2": "t-SNE 主成分2” 図：LGBMの重要度の可視化機械学習の予測には拡張期血圧が最も寄与

13.

解析機械学習モデルをSHAPで解釈 13

14.

上位者解法 Test Time Augmentation（TTA）とは 14 • Test Time Augmentation（TTA） • • テストデータに対して、データ拡張（回転・反転など）を行い、それぞれの精度のアンサンブルする手法メリット • Robust • 特にデータが少ない時 • 実装コストが低い • 計算コストも別実験するより低い • データが少ないほど効果は大きい • 論文 • • Better Aggregation in Test-Time Augmentation https://arxiv.org/abs/2011.11156v2 特別賞と３位の方のSolution Ref: https://github.com/andrewekhalel/edafa

15.

上位者解法特別賞解法 • 解法がspeakerdeckで公開 • 前処理 • • 詳細はそちらを参照してください Ben’s Preprocessing • 画像の各ピクセルについて、その周囲の一定範囲内のピクセルの平均的な色（局所平均）を計算し、その値を各ピクセルから引く • • • https://kaggl e-forum-messageattachments.storage.googleapi s.com/88655/2795/competitionreport.pdf CenterCrop モデル • • 精度の良かった複数モデルのアンサンブル眼底画像のFoundation Modelから1次元特徴量を取得し年齢とともにアンサンブル • • • 15 RETFound RET-CLIP その他 • TTA（Test Time Augmentation） • AutoGluon：簡単に機械学習してくれる AutoMLツール • 予測時にもデータ拡張を実施する手法 • https://auto.gluon.ai/stable/index.html Ref: https://speakerdeck.com/pon0matsu/yan-ke-aikontesuto2024-te-bie-shang-6wei-solution

16.

上位者解法 3位 • 解法がspeakerdeckに公開 • • • • • • 眼底部の切り抜き（左図参照）テーブルデータの0〜1MinMax Scaling 強力なデータ拡張（+0.03） • RandomHorizontalFlip, RandomVerticalFlip, RandomRotation, RandomAffine, ColorJitter, RandomPerspectiv 補助損失（+0.01） • 全データを利用モデル • • • 詳細はそちらを参照してください前処理 • • 16 1段階目（単一で0.680） • • • serenext26t_32x4d.bt_in1k maxvit_tiny_tf_224.in1k 2つを5foldでアンサンブル • • 1段階目の結果＋testデータを含めて学習 50modelのアンサンブル 2段階目 • • 2model x 5fold x 5seed Ref: CommonLit Solutionの紹介と考え方- Fulltrain戦略と (Seed/Model)Ensembleの可視化 - 前処理：眼底部の切り抜き推論 • TTA（Test Time Augmentation） • 元画像＋上下反転＋左右反転で行い、単純加算平均その他 • GitHubでコードの公開 • https://github.com/Neilsaw/jsaio_2024_solution Ref: https://speakerdeck.com/neilsaw/di-5hui-ri-ben-yan-ke-aixue-hui-zong-hui-aikontesuto-3wei-jie-fa

17.

上位者解法２位 • 前処理 • • 眼底画像の黒の背景を中間色で埋める 20 hold • データを均一に分割するために、主成分分析で次元削減後、クラスタリングを用いて 20分割 • 損失関数：BCEとMSEを使用 • アンサンブル学習ではMSEが良い • データ拡張：通常の方法に加え、上下反転など • Model • • • • EVA, EfficientNet, ViT, ResNeXtのモデルを使用メタボの有無と、メタボ以外の特徴量を同時に推測推測結果を結合し、LightGBMとXGBoostで学習約4000〜5000個のモデルをアンサンブル • Model, Seed アンサンブル 17

18.

上位者解法１位 • 前処理 • • 表データの解析から腹囲に注目学習に不適切と判断したデータを削除 • • • • （明らかにおかしいものやアステロイド硝子体症） 5000枚を確認し251枚削除？ • （全体の5％）層化k分割交差検証で分割 Model 1. 2. 3. 4. 5. 6. 7. Backbone • • • 18 seresnext, convnext-base, swin T Pooling（num_feature→256） Linear BatchNorm1d Dropout Relu Linear 256→1（メタボと腹囲の予測）補助損失を利用アステロイド硝子体症 • • • 片眼性かつ非炎症性の変化で、小さなカルシウム等の球状の粒子が正常な硝子体の中に蓄積する疾患人口の約1％の患者数で特に高齢者・男性に多く発症糖尿病・高血圧などに合併して発症することが特徴アステロイド硝子体症の眼底画像

19.

まとめ • 19 上位者解法の共通点 • 機械学習の基本的な手法は全て試す必要あり • データ拡張・アンサンブルなどなど • • • • • これをすることで上位に入れる可能性が高い補助損失（Auxiliry Loss）←ほぼ全員 Seed, foldアンサンブル←ほぼ全員 Test Time Augmentation←特別賞・３位解法全データのアノテーション← 1位解法 • Kaggleなどのコンペでメダル獲得圏で使用されていた手法を実装 • 所感 • 医療分野のコンペであったため、非常に楽しかった • 運営の方々、ありがとうございました！ • Leaderboardがなく、最後にcsvファイルの提出のみで自身の立ち位置が不透明となり、モチベ管理が大変だった • KaggleのCommunity Competitionを使用したらいいかも • • • Discussion, Notebookでもっと盛り上がって初心者にもフレンドリーかも準備で運営コストが上がる懸念 https://www.kaggle.com/c/about/community

https://www.kaggle.com/c/about/community