[DL輪読会]SiamMOT: Siamese Multi-Object Tracking

285 Views

June 11, 21

#deep learning #SiamMOT #Deep Learning #Object Tracking #Siamese Multi-Object Tracking #Machine Learning

スライド概要

2021/06/11
Deep Learning JP:
http://deeplearning.jp/seminar-2/

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

【DL輪読会】KAN: Kolmogorov–Arnold Networks

Deep Learning JP 84.7K

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

Deep Learning JP 59.4K

【拡散モデル勉強会】拡散モデルの数理

Deep Learning JP 54.2K

【拡散モデル勉強会】Introduction to Diffusion Models

Deep Learning JP 38.8K

【拡散モデル勉強会】拡散モデルのサンプラーまとめ

Deep Learning JP 33.3K

【DL輪読会】Cosmos World Foundation Model Platform for Physical AI

Deep Learning JP 32K

各ページのテキスト

DEEP LEARNING JP [DL Papers] SiamMOT: Siamese Multi-Object Tracking Kotaro Omori, Suzuki Yonekura Lab http://deeplearning.jp/ 1

http://deeplearning.jp/

Object trackingとは • 物体の追跡を⾏なうタスク • 以下のように分類される – – – – SOT or MOT Short term or Long term Siamese or Correlation Filter オンライン or オフライン 2

既存⼿法の課題 • Siamese trackers in SOT – Detectorとtrackerが分離されている(DeepMOT) • Tracking-by-Detection in MOT – Object detection, optical flow, re-identificationを組み合わせているため計算量的に⾮効率 • Online MOT – 学習時間がかかる • Motion Modeling in SORT – 位置や箱の形といった単純な情報を元に追跡している 3

SiamMOT: Siamese Multi-Object Tracking 4

Siamese Tracker • Object Trackingを⽬標画像から抽出される特徴表現と探索画像から抽出される特徴表現間の相互関係により得られる汎⽤的な類似性マップを学習することで解く • 代表的な⼿法 – SiamRPN • 各グリッドに bounding box の基準となるアンカーを設定し、各グリッドは各アンカーの物体らしさとアンカーのbounding boxの正解への座標と幅と⾼さへの補正値を出⼒するように学習 5

Siamese trackerによるMotion modeling • Siam TrackerによるMotion modelingを複数instanceに並列で⾏う 6;< • 3465 : フレーム8 6 から抽出された特徴量, 3:6;< : フレーム8 から抽出された特徴量 5 – Mask-RCNNのROI(Region of Interest)という部分で抽出される – FG : オブジェクトのある領域、HG : 探索領域,bounding boxの中⼼位置を保ったままr倍する • LG6;< : M + δにおけるPQRMSQTU PのLPRPVPWPMX RTYZU – t+δにおいてinstanceがvisibleなら⾼いスコアになる 6

Implicit motion model (IMM) • 2つのフレームから特徴量を連結してMLPに学習させることでobject trackingする⼿法 • 以下のように表される 7

Explicit motion model (EMM) • 本⼿法ではこちらを取り⼊れている • IMMに⽐べて以下の点で優れている – Channel単位で独⽴に学習ができる – より細かいピクセルレベルの学習ができる • 以下のように定式化される 8

RPN features • RPN (Region Proposal Network) – フレーム! "#$の画像に対してObject detectionを⾏なうネットワーク – Siamese Tracker による予測とテンプレートマッチングを⾏なう 9

10.

IOU / NMS操作 • NMS (Non Maximum Suppression) – 同じクラスとして認識された領域の重複を防ぐためのアルゴリズム • IOU (Insertion over Union) – 領域の重なり度合いを表す指標 • Area of overlap / Area of Union 10

11.

Training and Inference • 損失関数 – ! = !#$% + !'()(*) + !+,)-,% • 推論 – IOU基準のNMS操作により以下がそれぞれ⾏われる • Siamese Trackerによる予測 • RPNによるinstanceの検知 • Spatial matching – IOUが0.5以上のところをmatchとする • solver – Visibly confidenceが閾値αを超えているもの – Matchしなかった領域でvcが閾値β を超えるところは作る – 閾値αを下回る部分を消す 11