[DL輪読会]CartoonGAN: Generative Adversarial Networks for Photo Cartoonization

>100 Views

June 28, 18

#deep learning #Deep Learning #Generative Adversarial Networks #CartoonGAN #Photo Cartoonization #AI

スライド概要

2018/06/22
Deep Learning JP:
http://deeplearning.jp/seminar-2/

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

【DL輪読会】KAN: Kolmogorov–Arnold Networks

Deep Learning JP 84.9K

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

Deep Learning JP 59.5K

【拡散モデル勉強会】拡散モデルの数理

Deep Learning JP 54.5K

【拡散モデル勉強会】Introduction to Diffusion Models

Deep Learning JP 39.1K

【拡散モデル勉強会】拡散モデルのサンプラーまとめ

Deep Learning JP 33.5K

【DL輪読会】Cosmos World Foundation Model Platform for Physical AI

Deep Learning JP 32.5K

各ページのテキスト

DEEP LEARNING JP [DL Papers] “CartoonGAN:,Generative,Adversarial,Networks,for,Photo, Cartoonization,(CVPR2018)”, Haruka,Murakami,Matsuo,Lab http://deeplearning.jp/ 1

http://deeplearning.jp/

書誌情報 • CVPR’18 (6/18~22) • Archiveへの公開なし、出たばかりなので引用はまだない • 著者 – Yang Chen∗ Tsinghua University, China – Yu-Kun Lai ∗ Cardiﬀ University, UK – Yong-Jin Liu * Tsinghua University, China • 内容：写真(風景画)をGANでアニメ調に変換する – 訓練に風景画とアニメ画を使うが、ペア画像でなく無関係のセットをそれぞれ学習 • 選定理由：データセット作成時に確率分布からの生成以外で新しいデータを増やす方法を考えていた：この紹介と全く同時間に発表が行われているためアメリカは夕方でめっちゃタイムリー 2

アニメ調に変換するのは簡単そうに思えるが ◎現状の手法 • Non-photorealistic rendering (NPR) • NNで変換どちらも 1) 高度なシンプル化、抽象化が必要 2) はっきりした輪郭、滑らかな色調変化、シンプルなテクスチャの実現が難しいという問題 3

近年の技術では？ • Style Transfer ‒ 参照画像が１枚のため細部に作家の個性が再現されない、輪郭検出が甘い • Cycle GAN ‒ 双方向変換するため時間を食う、やはり単純化や抽象化ができない • 実用的ではないので、アニメ調への変換に特化させたGANを作成した 1. 入力画像(写真)セットと参照画像(アニメ画)セットを関連付けず訓練させ、どの作家の画風でも学習できるようにした 2. ２つの効果的な損失関数を用いた 3. 収束性を高める初期化のフェーズを作成し、計算速度を高める＆勾配消失を防いだ 4

CartoonGanののアーキテクチャ • • Dに全体画像ではなく部分画像で判断させ、パラメータを減らしている点が面白い全体で判断させると、物体の輪郭の割合が小さすぎて輪郭のシャープさが判断できない→損失関数１ 5

損失関数１実験的にw,= 10,の時がベスト１．輪郭をクリアにするアニメ画像とその輪郭をボカした画像を作成してペアにし、ボカした画像を失敗例とする 6

損失関数２実験的にw,= 10,の時がベスト２．内容の保持先行研究からpre-trained 通常はl2 lossだが、l1 lossを使うことがキモらしい 7

画像の初期化 • Gを最初の10epochのみ損失関数２（Lcon)で学習 • NVIDIA Titan Xp GPUで1 epoch あたりの計算時間がCycleGAN:3020.31s, CartoonGAN :1517.69s 8

結果：「君の名は」に出てくるのと同じシーンの風景写真をアニメ調に変換元風景写真 (M,=,,5402) , , , , ,CartoonGAN適用後,(N,=,4573) • 点字ブロックが崩壊しているのを除けば概ね良好 9

10.

結果：新海監督と宮崎監督の画風への変換 10

11.

他手法との比較 11

12.

Feature work • 顔画像への適応 • 連続性を考慮した制限（動画）にも今回の損失関数を使えるようにしたい 12