2.6K Views
October 15, 21
スライド概要
2021/10/15
Deep Learning JP:
http://deeplearning.jp/seminar-2/
DL輪読会資料
DEEP LEARNING JP 論文紹介: [DL Papers] Invariant Risk Minimization Ryosuke Ohashi, bestat inc. http://deeplearning.jp/
書誌情報 ◆ 2019/7にarXivに投稿された論文(https://arxiv.org/abs/1907.02893) ◆ 概要 ◆ ◆ 複数のデータ分布を跨いで存在する不変な相関関係を推定する新手法を提案 選定理由 ◆ 因果関係に注目したDG手法の先駆けということで気になっていたため 2
背景:OODへの汎化問題 ◆ ←OODでは気まぐれに予測ミス ◆ ←訓練データセットでは正確に予測 Torralba, Efros. Unbiased Look at Dataset Bias. ◆ 学習ベースのAIがOOD(訓練データ分布外)で気まぐれに挙動してしまう ◆ これだと信頼性がクリティカルに求められる応用には使えない ◆ 医療,自動運転,自動決済,etc. 3
背景:データセットバイアス,偽りの特徴 ◆ 牛とラクダの分類問題 ◆ 偽りの因果関係 ◆ 『画像の下半分が緑っぽくて上半分が青っぽい⇒牛』 ◆ ◆ 牛?! モデルがデータセットのバイアスにフィットしてしまうと... ◆ 真の因果関係に基づかず「偽りの相関関係・特徴」を使いタスクを解こうとしまう ◆ Correlation-causation dilemma 4
背景:ドメイン汎化 ◆ 以下のようなことが出来ないか? ◆ カラーの写真,油彩画像で分類器を訓練 ◆ ⇒モノクロのペン画でも上手く分類 DomainNet dataset from Peng et al. Moment Matching for Multi-Source Domain Adaptation ◆ 複数の環境でモデルを訓練し,未知環境にも上手く汎化させたい ◆ 未知環境にも通用する「共通ルール」をモデルに学習させられないか? ◆ 特定環境固有のバイアスに起因する「偽りの相関関係」を棄却させられないか? 5
提案手法:IRMのアイデア ◆ IRM(不変リスク最小化)という新手法を提案 ◆ ◆ アイデア:特定環境固有の「偽りの特徴」を抽出してしまう特徴抽出器が あったとする.その特徴を使って環境毎に個別に構築した最適な分類器は 互いに異なるものになる(※環境毎に,その環境固有の「偽りの特徴」が 分類に最も強く寄与する形になるため). IRMでは,「どの環境でもその特徴を使って構築した最適な分類器が一致 する」という条件を満たす特徴抽出器を探す.ただし,抽出される特徴が タスクを解くのになるべく有用であるようにもする. 6
提案手法:IRM ◆ Joint ERM ◆ + ◆ 環境共通の分類器が ◆ 各環境で同時に最適 ◆ ここでwは線形回帰or 分類器(の係数) 7
提案手法:IRM v1 ◆ IRMの目的関数は最適化ループがネストしていてチャレンジングなので簡易版 も提案(※以下の説明では目的変数は1次元) ◆ w=(1,0.,,,.0)にしてしまう ◆ ◆ ◆ wを可逆行列で変換してしまった分をΦに吸収してしまえるので w=(1,0.,,,.0)が最適に近いかどうかはリスクの勾配ノルムでソフトに評価す る ハイパラλで特徴抽出器の有用性と不変性を調節する 8
実験結果1-1 ◆ ◆ シンプルなSEM(構造方程式モデル)にいくつかコントロール条件を付けて実験 入力変数X_1, X_2から上記SEMで定まる潜在変数Yを線形回帰推定するモデルをいくつ かの環境サンプルから学習させる: ◆ 真の因果関係を捉えているほど ◆ 偽りの相関関係に引っ張られているほど ◆ コントロール条件 ◆ が0から遠のく 観測できない変数HがZやYに影響しない/する 均一分散(O)/不均一分散(E) ◆ ◆ に近づく 完全観測(F)/部分観測(P) ◆ ◆ は OかEかで環境固有のバイアスの出方が変わる 組み換え(S)/非組み換え(U) ◆ ZがXにある直交行列を掛けたものになっているか/いないか 9
実験結果1-2 ◆ 多くのコントロール条件下でERMより真の因果関係をよく捉えられており,偽 りの相関に引っ張られにくくなっている 10
実験結果2 ◆ NNとして浅いMLPを使い,ColorMNISTというデータセットでも実験 ◆ ColorMNIST ◆ ◆ ◆ ◆ MNISTに数字から決まるバイナリラベルを各画像につけておく(真の生成過程) 環境パラメーターに応じて各画像に赤or緑色を塗り,環境によって色とバイナリラベ ルの間に異なる割合で相関が生じるようにする 複数の訓練環境のいずれも赤色とラベル0の相関を高くするが割合は様々にしておき, テスト環境では相関が逆転しているようにする ERMは偽りの相関にフィットしてしまうが,IRMはテスト環境でも好成績 11
まとめ,感想 ◆ まとめ ◆ ◆ ◆ 複数環境から学習することで環境固有のバイアスに起因する偽りの相関によ る悪影響を軽減しつつ真の相関を推定する手法IRMを提案 シンプルなSEMやColorMNISTでIRMの効果を実験的にも確認 感想 ◆ 距離ベースのDG手法に比べて,IRMはデータセットバイアスに左右されない 真の因果関係を捉えたい,という狙いをそのまま具体化するような試みに なっていて面白いと思った 12