[DL輪読会]In Search of Lost Domain Generalization

105 Views

July 16, 21

#deep learning #Deep Learning #Domain Generalization #Ryosuke Ohashi #DomainBed #DG research

スライド概要

2021/07/16
Deep Learning JP:
http://deeplearning.jp/seminar-2/

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

【DL輪読会】KAN: Kolmogorov–Arnold Networks

Deep Learning JP 84.7K

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

Deep Learning JP 59.4K

【拡散モデル勉強会】拡散モデルの数理

Deep Learning JP 54.2K

【拡散モデル勉強会】Introduction to Diffusion Models

Deep Learning JP 38.8K

【拡散モデル勉強会】拡散モデルのサンプラーまとめ

Deep Learning JP 33.3K

【DL輪読会】Cosmos World Foundation Model Platform for Physical AI

Deep Learning JP 31.9K

各ページのテキスト

DEEP LEARNING JP 論文紹介 [DL Papers] In Search of Lost Domain Generalization Ryosuke Ohashi, bestat inc. http://deeplearning.jp/

http://deeplearning.jp/

書誌情報 https://iclr.cc/virtual/2021/poster/2998  選定理由  仕事で Domain Adaptation 手法を試しており，それより難しい条件設定の Domain Generalization って今どんな感じなの？と気になったため 2

https://iclr.cc/virtual/2021/poster/2998

概要  問題   手法   ドメイン汎化がさかんに研究されているが，実験設定がまばらで結果の比較がなされていない最近のDG手法いくつかを共通の実験設定で比較結果  ERM(vanilla)とSOTA手法とでテスト性能に大差出なかった 3

OpenReviewでの著者コメント（意訳）  一定の実験条件下でのネガティブな結果にすぎないことには留意してほしい  再現可能・公正な実験コードをオープン公開したので，DGの研究に活用してほしい💪 4

背景：OODへの汎化問題 Torralba, Efros. Unbiased Look at Dataset Bias.  AIが訓練データ分布外で気まぐれに挙動してしまう  信頼性の求められる応用には使えない😐 5

背景：ドメイン汎化 Muandet et al. Domain Generalization via Invariant Feature Representation. DomainNet dataset from Peng et al. Moment Matching for Multi-Source Domain Adaptation  複数の環境でモデルを訓練し，未知環境にも上手く汎化させたい  未知環境にも通用する「共通ルール」をモデルに学習させられないか？ 6

問題：ドメイン汎化研究結果の乱立  近年DG手法がさかんに研究・発表されている  CORAL (Sun & Saenko)  DANN (Ganin et al.)  MLDG (Li et al.)  IRM (Arjovsky et al.)  Etc...  論文により扱っているデータセット，モデル設計・選択基準，訓練テクニックが異なる  再現可能・公正な比較がなされていない  研究・応用時に困る😭 7

手法：再現可能・公正な比較実験  DG手法の再現可能・公正な比較実験を実施  実装をDomainBedプロジェクトとしてオープン公開🧪   https://github.com/facebookresearch/DomainBed 特徴  14つのDG手法  7つのデータセット  3つのモデル選択基準  モデルはResNet-50 pretrained on ImageNet 8

https://github.com/facebookresearch/DomainBed

結果：ERM(vanilla)がcompetitive 9

10.

まとめ，感想  まとめ  DG手法の再現可能・公正な比較実験を実施  ERMとSOTA手法でテスト精度に大差出なかった    あくまでも一定条件下でのネガティブな結果にすぎないことには留意今後の発展に向け，実験コード(DomainBed)をオープン公開感想  上手くDGさせるために欠けているものは何か？を考える良いきっかけになった 10

11.

雑感：Adaptationとの比較  論文の結果に比べると，Domain Adaptation手法は多少上手くいく印象がある  テストドメイン上での特徴抽出器の挙動を躾けられるから？  DGの問題設定だと，テストドメインに似た訓練ドメインを人海戦術で用意しまくるしかない？  ラベル付けできなくてもUnsupervised Domain Adaptationを使える  メタな知識や生成モデルを使ってテストドメインに似た訓練ドメインを仮想的に作れる？  人間がメタ知識を明示的に訓練に入れ込んだり，生成モデルを作り込むことになる  Online Adaptation路線を進むのが良い？  一番「知的生命体」っぽい👶  Adaptationしつつメタ知識や生成モデルを形成・成長させていくような機構があるとよい？ 11

12.

雑感：モデル設計，データ拡張  大きなネットワークのほうが汎化力も上がる，という定説（？）はDGの文脈でも成り立っていそう   特徴抽出器のテストドメイン上での気まぐれさが減る？？データ拡張はドメイン汎化力にプラスになることもあればマイナスになることもある  Consistency/Contrastive Learningを使うとDGの文脈でも大きなプラスにならないか？ 12

13.

雑感：モデル選択  「テストドメイン上でvalidation > 訓練ドメイン上でvalidation」は分かる  「訓練ドメイン上でvalidation > 訓練ドメイン間でcross-validation」は何故？  あるfoldでvalidation用に取り除いた訓練ドメインが，training用に残した訓練ドメインのいずれとも類似性が低いと，最適なハイパラが乱れてしまう？ 13