【物体検出】SSD

544 Views

November 28, 24

スライド概要

profile-image

AI・機械学習を勉強したい学生たちが集まる、京都大学の自主ゼミサークルです。私たちのサークルに興味のある方はX(Twitter)をご覧ください!

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

2024年度後期輪読会 第7回 [物体検出] SSD 京都大学 工学部 情報学科 宮前明生 0

2.

アジェンダ  SSD以前モデルの課題点  SSDの推論  SSDの学習  実験結果 1

3.

アジェンダ  SSD以前モデルの課題点  SSDの推論  SSDの学習  実験結果 2

4.

SSD以前のモデルの課題点  SSD以前の物体検出モデル(Faster R-CNNなど) 1. バウンディングボックスを検出する 2. 各ボックスに分類器を適用する  課題点 • 計算量が多く、リアルタイム検出に向かない  SSDの概要 • バウンディングボックスを検出と分類を同時に予測する • YOLOよりも計算が早く、Faster R-CNNと同等の精度を出した 3

5.

アジェンダ  SSD以前モデルの課題点  SSDの推論  SSDの学習  実験結果 4

6.

SSDの推論  推論の流れ 1. 異なる大きさで特徴マップに分割する 2. それぞれの特徴マップのマス目ごとに、アス ペクト比で4~6種類のデフォルトボックス を生成する 3. デフォルトボックスに対して、画像の分類 (クラス分類問題)と、大きさと位置(回帰 問題)を推測する 4. 後処理 5

7.

SSDの推論  畳み込みフィルタ • 3×3の畳み込みフィルタを利用している • 画像を縦横38,19,10,5,3,1分割して特徴マップごと畳み込みをする • 特徴マップの1マスの畳み込みフィルタの出力は ( 4~6種類のデフォルトボックス)×(画像分類(classes)+画像の位置(2)+画像の高さと幅(2)) • 生成されるデフォルトボックスの総数は(特徴マップのマス数)×( デフォルトボックスの種類) 38×38 ×4+19 ×19 ×6+10 ×10 ×6+5 ×5 ×6+1 ×1 ×4=8732 6

8.

アジェンダ  SSD以前モデルの課題点  SSDの推論  SSDの学習  実験結果 7

9.

SSDの学習  学習するデータ • 学習データはGTボックスとそのカテゴリを持つ • 8732個の全てのデフォルトボックスを学習させるのではな く、一部を近しいGTボックスとマッチングさせて学習する  マッチング • マッチングの評価指標としてJaccard係数を用いる • 各GTボックスを最大のJaccard係数を持つデフォルトボッ クスをマッチングさせて、 閾値(0.5)よりも大きい Jaccard係数を持つGTボックスにデフォルトボックスを マッチングさせる • マッチングしたデフォルトボックスをポジティブ、残りを ネガティブとして扱う 8

10.

SSDの学習  損失関数 • i番目のデフォルトボックスが、クラスpのj番目のGTボックスにマッチする かを で表す • はポジティブなデフォルトボックスの数 • は各クラスの信頼度、 は予測ボックス、 はGTボックス • 損失関数は、ボックス推定の損失と、クラス分類の損失からなる • は交差検証から1とする 9

11.

SSDの学習  ボックス推定の損失 • は予測ボックスの中心、 は幅、 は高さ • ボックス推定の損失は、ポジティブな推定ボックスとGTボッ クスの差分のsmooth L1 loss • 、 はデフォルトボックスの中心から差分、 、 はデ フォルトボックスから何倍したかを対数で表す。( 倍したら ) • GTボックスは次のようにデフォルトボックス で正規化する。 10

12.

SSDの学習  クラス分類の損失 • クラス分類の損失は、ポジティブな推定ボックスの分類に対する交差エント ロピーと、ネガティブなボックスの分類に対する交差エントロピーからなる • ネガティブなボックスは背景クラス • は各クラスの信頼度 に属することを正解とする でソフトマックスを取った 11

13.

SSDの学習  デフォルトボックスのスケール • 特徴マップに分割するスケールによって、デフォルトボックスのスケールを 決定する。 • 分割する特徴マップの種類がm個、特徴マップが小さい順にk番目とすると、 デフォルトボックスのスケールは • このモデルでは、 とした(1.0は画像全体の大きさ) 12

14.

SSDの学習  デフォルトボックスのアスペクト比 • アスペクト比は • • がある と幅、高さが表される のとき、スケールが , のデフォルトボックスも追加する • 計6種類のデフォルトボックスがある 赤のボックスが 13

15.

SSDの学習  ハードネガティブマイニング • ネガティブなボックスが多いので、ポジティブなボックスとネガティブなボックス の比が1:3になるように、ネガティブなボックスのクラス分類の損失 ー が大きい順に選ぶ。 • つまり、ネガティブなボックスのうち背景クラスの確率が低いもので学習する  データ補強 • そのまま • 画像の切り取りとGTボックスのJaccard係数の最小値が0.1,0.3,0.5,0.7,0.9にな るようにサンプリング • ランダムに画像を切り取りサンプリング • 画像の反転など 14

16.

アジェンダ  SSD以前モデルの課題点  SSDの推論  SSDの学習  実験結果 15

17.

実験結果  精度 16

18.

実験結果  SSDの構成要素の貢献度 • Data augugmentationとは、データ補強 • Atrous Convolutionとは、隙間をあける畳み込み 17

19.

実験結果  計算速度と精度 • FPSは1秒あたりに処理できる画像の枚数 18

20.

参考文献  1512.02325(SSD)  https://qiita.com/ikeyasu/items/a95448254dff958a05b5  https://calc-life.hatenablog.com/entry/2022/10/01/144518 19