1.4K Views
October 27, 23
スライド概要
DL輪読会資料
アーキタイプ分析の 臨床分野における応用 松尾研 輪読会 2023.10.27 東京慈恵会医科大学 博士課程D3 佐野 圭
アーキタイプ分析とは
アーキタイプ分析(AA)の概念イメージ データ群をアーキタイプ(AT)の線形和で示す次元削減 架空の動物 30% 20% 50%
AAの図形的な定義 凸包(convex)の発想で 多次元空間における データ群の頂点を知りたい まず頂点数を決めた後 損失 = convexと漏れた赤点との 最小距離(赤線)の二乗和 損失を最小化する 頂点(AT)を求める. 出典:https://www.researchgate.net/publication/344671912
AAの数学的な定義 個体 axis=0の和が1 アーキタイプ Y (A) を初期化 Z を更新 Y (A) を更新 出典:https://www.researchgate.net/publication/344671912
臨床研究への応用
視野検査とは? 半径30°の視野に存在する 網膜神経節細胞は全体の80% 視野検査 76次元データ
視野検査とは? 視野検査(右眼) 眼底写真(右眼)
緑内障とは? 初期 中期 緑内障では数年かけて視野が増悪 後期 「視野の悪さ」をMD値で定量化 増悪するほどMD値が低下
視野のアーキタイプ分析 ・高眼圧症から緑内障に至った176人 2231枚の視野 ・18種類の視野アーキタイプ (AT) P1-P18 を同定 ・ある視野パターン(P15)を有する視野では 視野進行リスク(<-1dB /year)が大きかった
視野データをP1-P18のATに分解 論文では18のAT(P1-18)を特定 ATの数はhyper parameterで 任意の数字を指定可能 多いほど正確な表現ができるが 多すぎても過学習のリスク
具体的な3症例 1) 2) 症例1-3の比較 症例1) MD 1.2 dB 進行せず 症例2) MD -6.8 dB 進行せず 症例3) MD -6.7 dB 急速に進行 症例3だけ進行?その特徴はなにか? 3) 症例3などの急速進行眼には P15が高頻度で出現 →これが関連因子なのか多変量解析
視野進行とP15の関連 目的変数 視野進行(<-1 dB /year)の有無 説明変数 P15の有無 一般化推定方程式(GEE)で 年齢・性別・初期MDを調整 β SE Wald値 p-value 単変量 14.8 4.3 11.6 0.0006 多変量 15.3 5.9 6.8 0.009
技術的な応用
AAの弱点 3頂点だと表現力に難あり 5頂点なら正解ATも含むが過学習 出典:Keller SM+, NIPS 2019.
潜在表現に対するAA 出典:Keller SM+, NIPS 2019.
潜在表現に対するAA 出典:Dijk DV+, IEEE big data 2019.
初期化の工夫 AA++法 qはconvex内のATを示し 各ATと最小距離のデータ点のみ見て MSEを計算し、その総和をロスとする. ↓ Xの一部X(i)をサンプリングして 確率PIに基づき X(i)からX(j)に更新. 更新した場合は A=XY も更新. ↓ 上記で最適なAの初期値を定めた後 通常のAAの学習でY,Zを最適化する. 出典:Mair S+, arxiv 2023.
初期化の工夫 AA++法 Uniform sampling FurthestFirst FurthestSum AA++と亜型(提案手法) ↓ 提案手法の損失(MSE) が圧倒的に小さい!
Wasserstein-AA データ間の関係性をWasserstein距離で定義 利点として、外れ値があってもロバストに動作した 出典:Craig K+, arxiv 2023.