Public Visual Relocalization

481 Views

November 21, 24

スライド概要

株式会社サイバーエージェントで取り組んでいる Visual Relocalization のご紹介です。

データセットはパートナーであるサツドラホールディングス株式会社様の EZOHUB TOKYO で取得しています。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

第48回ロボティクス勉強会 Visual Relocalization CyberAgent AI Lab 石田岳志

2.

石田 岳志 Takeshi Ishita ● 所属: ○ CyberAgent AI Lab ● 出身: ○ 山梨県笛吹市 ○ 桃がたくさん採れる 写真 ● 学歴: ○ 東京高専 専攻科 (学士) ● 専門: ○ Visual SLAM, Visual Localization ○ LiDAR SLAM (ちょっと)

3.

目指すもの 学術貢献 事業貢献 自己位置推定 3次元復元 環境理解

4.

手軽に導入可能な位置推定 LiDAR… まだちょっと値段が高い カメラ... 物体認識にも使えるし安い 今回は地図に対するカメラの位置推定をご紹介

5.

Visual Relocalization 地図上でカメラがどこにあるのかを推定する問題

6.

2つのステップ:地図復元と位置推定 COLMAP での地図復元 RGB画像 COLMAP 画像特徴つき 点群地図 位置推定 RGB画像 画像特徴つき 点群地図 6DoF カメラ 姿勢

7.

今回は位置推定を解説 COLMAP での地図復元 RGB画像 COLMAP 画像特徴つき 点群地図 位置推定 RGB画像 画像特徴つき 点群地図 6DoF カメラ 姿勢

8.

実際に位置推定してみる 8

9.

画像から地図を作る:データの収集 パートナーである サツドラホールディングス株式会社様の EZOHUB TOKYO でデータ取得 RealSense D455 の RGB カメラを利用 ● 視野角が広い ● キャリブレーションパラメータが わかりやすい

10.

画像から地図を作る:COLMAPによる地図復元 画像の情報が埋め込まれている → 姿勢推定に利用できる 赤いものはカメラ姿勢

11.

入力画像と地図をマッチングし、位置推定 緑枠:推定成功 赤枠:推定失敗 動画は4倍速 https://www.youtube.com/watch?v=OBBnJqUkoQg パートナーであるサツドラホールディングス株式会社様のご協力のもと EZOHUB TOKYO でデータを取得しました

12.

動作の仕組み 12

13.

3ステップで位置推定 1. 画像検索 入力画像と特徴点マッチングできる画像を地図から探す 2. マッチング 入力画像の特徴点と地図内の3次元点を結びつける 3. 姿勢推定 2次元点と3次元点の対応からカメラ姿勢を求める

14.

前提:カメラの表現 カメラはどのように物体を見ている? 3次元点を2次元点に投影する

15.

前提:地図の表現 地図は 2次元点と3次元点の対応で 表現される

16.

姿勢推定の手順:画像フレームを入力する 姿勢推定したい画像フレームを 入力する

17.

姿勢推定の手順:画像検索 入力フレームと 特徴点マッチング可能な画像を 地図フレームの中から探す

18.

姿勢推定の手順:画像検索 特徴点マッチングするフレームを 指定する

19.

姿勢推定の手順:マッチング 地図内のフレームに対して 特徴点マッチングを行う 入力画像の2次元点と 地図内の3次元点の 対応関係が得られる

20.

姿勢推定の手順 得られた対応関係を使って カメラの姿勢を推定する PnP問題という よく知られた問題に落とし込めるので 簡単にカメラ姿勢推定できる

21.

カメラによる姿勢推定の利点・欠点 利点 ● 安価なセンサで位置推定可能 ● 省スペース、省電力 欠点 ● 地図作成に時間がかかる ● 地図と特徴点マッチングできない画像の姿勢は推定できない ● 入力画像ごとに地図を全探索しているため、遅い ○ オドメトリ推定と組み合わせることで改善可能

22.

Relocalizationのコードとデータを公開しています!! リポジトリURL: github.com/CyberAgentAILab/visual-relocalization-colmap データセットURL: huggingface.co/datasets/cyberagent/in-store-visual-localization パートナーであるサツドラホールディングス株式会社様のご協力のもと EZOHUB TOKYO でデータを取得しました

23.

今後の予定 地図環境の理解 ● 何がどこに写っているのか ● 店舗で使う場合、商品の種類や位置を知りたい オドメトリと組み合わせて高速化 ● 高速で滑らかな動作を目指す