[DL輪読会]Memory-Augmented Attribute Manipulation Networks for Interactive Fashion Search

252 Views

July 12, 17

#Deep Learning #Fashion Search #VASILY # Inc. #Attribute Manipulation Networks #AlexNet

スライド概要

2017/6/16
Deep Learning JP:
http://deeplearning.jp/seminar-2/

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

【DL輪読会】KAN: Kolmogorov–Arnold Networks

Deep Learning JP 92K

【拡散モデル勉強会】拡散モデルの数理

Deep Learning JP 70.5K

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

Deep Learning JP 61.4K

【DL輪読会】Conditional Flow Matching

Deep Learning JP 53.9K

【DL輪読会】Cosmos World Foundation Model Platform for Physical AI

Deep Learning JP 50.8K

【拡散モデル勉強会】Introduction to Diffusion Models

Deep Learning JP 49.4K

各ページのテキスト

Memory-Augmented Attribute Manipulation Networks for Interactive Fashion Search 2017/06/16 (金) 後藤亮介 VASILY, Inc.

自己紹介 • 後藤亮介 (VASILY, Inc.) • 東京大学大学院天文学専攻出身 • 2015年の「ディープラーニング基礎講座」に学生として参加 • 現在の仕事： • 機械学習・画像認識を活用したファッション系サービスの開発

Deep Learningで作ったもの自然画像から商品画像を引き出すクロスドメイン検索

Deep Learningで作ったものファッションアイテム検出器

IBIS2016

IBIS2016 ・ノースリーブワンピースに「赤」の属性を付与していく・検索結果が徐々に赤いノースリーブワンピースに変化

Memory-Augmented Attribute Manipulation Networks for Interactive Fashion Search 2017/06/16 (金) 後藤亮介 VASILY, Inc. 8

書誌情報 • Memory-Augmented Attribute Manipulation Networks for Interactive Fashion Search • Bo Zhao, Jiashi Feng, Xiao Wu, Shuicheng Yan • CVPR 2017 Poster • https://www.researchgate.net/publication/316782095_MemoryAugmented_Attribute_Manipulation_Networks_for_Interactive_Fashion_Search uploaded) (2017/05/09

https://www.researchgate.net/publication/316782095_Memory-Augmented_Attribute_Manipulation_Networks_for_Interactive_Fashion_Search

10.

概要 • 画像検索において、ユーザーの求める属性を付与して、検索結果を変えられると便利 • 画像の属性を操作できるAttribute Manipulation Network (AMNet)を考案 • ファッションのデータセット(DARN, DeepFashion)で実験して、良いパフォーマンスを発揮

11.

Interactive Fashion Search ・「こんなコートが欲しいのだけど、色は青くて、襟はplush素材がいいな」・クエリ画像で表現しきれないユーザーの細かな希望を叶える画像検索

12.

問題設定クエリ画像求める画像・クエリ画像と求める画像の属性のほとんどは共通(1~2個程度だけ異なる) ・クエリ画像と求める属性から、求める画像の表現を得られれば良い・表現が得られれば、あとは近傍探索で取ってくるだけ

13.

提案手法：Attribute Manipulation Networks ・AMNetの全体像・画像の特徴量と，属性を加えた特徴量を抽出する・大きく4つの部分に分けられる

14.

1. Representation Learner ・画像の特徴量を抽出するネットワーク・クエリ画像、求める画像、ランダムサンプルのトリプレットを入力・この研究ではAlexNetを利用

15.

2. Memory Block ・Memory Blockは各属性の特徴を記憶している・クエリ画像に対して変更したい属性を入力し、その特徴を引き出す

16.

2. Memory Block ・勾配が得られるため、学習時にメモリを更新する・初期メモリは、各属性を持つ画像を属性予測タスクを学習させたAlexNetのfc7 (4096次元)の平均を取ることで得る。

17.

Attribute Manipulator ・属性の特徴と画像の特徴を合わせて、新たな4096次元の特徴を作る

18.

Loss Layer ・Classification Loss ・Ranking Loss ・Networks Optimization

19.

Fashion Search with Attribute Manipulation ・訓練クエリ画像 + positive 固有の属性 positive画像 (求める画像) negative (ランダムサンプル) を入力して得られるRanking LossとClassification Lossをネットワークに返す・検索事前にAlexNetを通して画像の特徴量を持っておく (manipulation無し) クエリ画像 + 属性の入力から得られる特徴量で、近傍探索する

20.

実験：データセット DARN Deep Fashion 320,000の洋服画像各洋服に9種の属性全179種の属性 290,000の洋服画像各洋服に6種の属性全1050種の属性

21.

実験結果 Top-k Accuracy Gallery Size毎のTop-20Accuracy ・新しいタスクなので，比較できる既存の研究がない・AMNet(青)から Memory Blockを除いたもの(緑) RankingLossを除いたもの(赤) AlexNetのfc7を使ったもの(ピンク) を比較

22.

実験結果 Top-k Accuracy Gallery Size毎のTop-20Accuracy ・Top-k AccuracyはどのｋでもAMNetが最も高い・Gallery Sizeを増やしても，Accuracyの減少が緩やかなのでRobust

23.

実験結果

24.

実験結果

25.

結論・属性を操作できる画像検索を実現・AMNetのアーキテクチャは比較対象に比べて優れた精度を達成感想・Triplet損失関数をつかって、直接、特徴空間を学習しているところが良さそう。・以前、C-VAEGANの中間層を使って同じことをやっていたが、学習の制御が難しかったし、画像検索という目的と最適化する目的関数が食い違っていたなぁ、と反省