【人工知能・深層学習】論文紹介：Synthetic Data Generation for Scarce Road Scene Detection Scenario

1K Views

August 25, 24

#論文紹介 #deeplearning #人工知能 #深層学習 #autonomous driving #合成データ生成 #物体検出 #自律走行 #希少データ

スライド概要

M2の出口裕希さんが論文「Synthetic Data Generation for Scarce Road Scene Detection Scenarios」の紹介を担当しました。本論文では自律走行での緊急車両の検出精度を高めるため、拡散モデルによるData Augmentationを提案しています。自律走行にかかわらず、データセットに稀であるが重要度の高い事象の検出は極めて重要なタスクです。一方、近年は質の高いデータが枯渇してきていると言われており、AI生成画像によるモデル性能を向上させる技術に関心が寄せられています。

Taki lab.

@8328889256

スライド一覧

立教大学大学院人工知能科学研究科における瀧雅人准教授が主催する研究室で2020年度からスタートしているまだ若い組織です。最先端の深層学習について、高度化・説明性向上などをテーマに深く幅広く研究しています。また医療や神経科学・物理学におけるデータ分析や、産業への社会実装にも携わっています。研究室内のPaper Reading活動の記録として、研究室学生の発表資料を公開しています。ご興味をお持ちの方は、HPをご確認ください。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

【人工知能・深層学習】レビュー：モダリティギャップの研究紹介

論文紹介 deeplearning 深層学習人工知能マルチモーダルモダリティギャップ

Taki lab. 2.9K

【人工知能・深層学習】論文紹介：Vision-Language Models Create Cross-Modal Task Representations

deeplearning 論文紹介深層学習人工知能 llm in-context learning task vector vlm

Taki lab. 2.7K

【人工知能・深層学習】論文紹介：DecomCAM: Advancing Beyond Saliency Maps through Decomposition and Integration

論文紹介 deeplearning 人工知能深層学習 vlm

Taki lab. 2K

【人工知能・深層学習】論文紹介：Towards Modular LLMs by Building and Reusing a Library of LoRAs

論文紹介 deeplearning 人工知能深層学習 lora

Taki lab. 1.7K

【人工知能・深層学習】論文紹介：You Only Need Less Attention at Each Stage in Vision Transformers

論文紹介 deeplearning 人工知能深層学習 vision transformer

Taki lab. 1.6K

【人工知能・深層学習】論文紹介：カーネルサイズ100を超えるCNN - PeLK

論文紹介 deeplearning 人工知能 cnn pelk 深層学習

Taki lab. 1.2K

各ページのテキスト

20240706 Journal club 論文紹介 Synthetic Data Generation for Scarce Road Scene Detection Scenarios (20240205)

紹介論文の概要題名 Synthetic Data Generation for Scarce Road Scene Detection Scenarios Dipika Khullar (Amazon Titan Labs) et al. NeurIPS 2023 Workshop SyntheticData4ML Submissions 論文の概要 AI生成画像を用いてデータセット中に希少な道路上のシナリオを再現し、それらの検出精度を高める From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 1

研究のモチベーションモチベーション自律走行で緊急車両（パトカー、消防車）を検出することは極めて重要である。一方で、このような希少なシーンの学習データは限られているため、合成画像を用いることは効果的なアプローチである。画像生成に深層学習モデルを用いることの課題課題原因 1 生成モデルの学習データ不足希少なシーンを生成させるためには学習データが必要であるが、そもそも十分なデータの準備が困難であるため 2 不十分な多様性とシーンの複雑さ昨今の画像生成はphoto-realisticにすることに焦点が当てられており、現実におけるシーンの複雑さの表現が不十分であるため 3 生成画像へのラベリングが必要なケースが存在 AIによって生成された画像は、適切に学習させるためラベリングが必要になる場合があるため 2

提案する画像生成アプローチアプローチ 1. 実際の背景に、希少な物体を生成 2. 実際の希少な物体に、背景を生成 3. 実際の画像を全体的に代替アプローチ 1, 2 アプローチ 3 From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 3

提案する画像生成アプローチアプローチ 1. 実際の背景に、希少な物体を生成 2. 実際の希少な物体に、背景を生成 3. 実際の画像を全体的に代替アプローチ 1, 2 アプローチ 3 From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 4

アプローチ1 実際の背景に、希少な物体を生成画像生成の流れ 1) マスク生成ブロック 2) テキストプロンプト作成ブロック 3) テキストに基づく画像生成拡散モデル 4) 超解像度モデル 2) 3) 4) 1) From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 5

アプローチ1 実際の背景に、希少な物体を生成画像生成の流れ 2) 1) マスク生成ブロック 4) 3) 2) テキストプロンプト作成ブロック 3) テキストに基づく画像生成拡散モデル 4) 超解像度モデル 1) From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 利用可能なバウンディングボックスのうち、他のバウンディングボックスを切断しないものの中からランダムに選ばれる From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 6

アプローチ1 実際の背景に、希少な物体を生成画像生成の流れ 2) 1) マスク生成ブロック 4) 3) 2) テキストプロンプト作成ブロック 3) テキストに基づく画像生成拡散モデル 4) 超解像度モデル 1) From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 事前に設定された、主語（消防車、パトカー）、述語（運転、駐車）、場所、状態（天候等）、時間（昼、夜）からPromptを生成 From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 7

アプローチ1 実際の背景に、希少な物体を生成画像生成の流れ 2) 1) マスク生成ブロック 4) 3) 2) テキストプロンプト作成ブロック 3) テキストに基づく画像生成拡散モデル 4) 超解像度モデル 1) From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 拡散モデルを用いて、マスクされた箇所に、 Promptに基づく画像を生成 From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 8

10.

アプローチ1 実際の背景に、希少な物体を生成画像生成の流れ 2) 1) マスク生成ブロック 4) 3) 2) テキストプロンプト作成ブロック 3) テキストに基づく画像生成拡散モデル 4) 超解像度モデル 1) From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 超解像度モデルを用いて、高解像度化 From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 9

11.

提案する画像生成アプローチアプローチ 1. 実際の背景に、希少な物体を生成 2. 実際の希少な物体に、背景を生成 3. 実際の画像を全体的に代替アプローチ 1, 2 アプローチ 3 From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 10

12.

アプローチ2 実際の希少な物体に、背景を生成画像生成の流れ 2) 1) マスク生成ブロック 3) 4) 2) テキストプロンプト作成ブロック 3) テキストに基づく画像生成拡散モデル 1) 4) 超解像度モデル From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 背景を生成するため、天候や街並みを変えることができる From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 11

13.

提案する画像生成アプローチアプローチ 1. 実際の背景に、希少な物体を生成 2. 実際の希少な物体に、背景を生成 3. 実際の画像を全体的に代替アプローチ 1, 2 アプローチ 3 From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 12

14.

アプローチ3 実際の画像を全体的に代替画像生成の流れ 1) 1) テキストプロンプト作成ブロック 2) 2) 超解像度兼画像変更モデル From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 超解像度モデルにPromptを条件づけることで画像全体を変換 From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 13

15.

提案手法の性能評価提案手法による希少シナリオ（緊急車両）検出精度の改善結果 • S1, S2は従来手法と比較して、検出精度が改善傾向にあり、２つを組み合わせると特に効果大 • 興味深いことに、通常の車両の検出精度も向上する傾向 Datasetの意味 • R：実際の画像 • AUG：従来のdata augumentation (Holizontal flipなど) • S1：本論文のアプローチ1 • S2：本論文のアプローチ2 & 3 From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 14

16.

本研究の課題画像生成による残課題 • 拡散モデルの性質上、異常な画像が生成され得るため、学習に悪影響を与えている可能性がある 1. 物体的な相対的な大きさ 2. 物体の数 3. 物体の相対的な位置 From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 15

17.

紹介論文のまとめ題名 Synthetic Data Generation for Scarce Road Scene Detection Scenarios Dipika Khullar (Amazon Titan Labs) et al. NeurIPS 2023 Workshop SyntheticData4ML Submissions まとめ提案手法は実データが限られている際に検出精度を高める実用的な手法となり得る。また、既存のAugumentationの代替にもなる可能性がある From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” From “Synthetic Data Generation for Scarce Road Scene Detection Scenarios” 16

18.