ワンダリア横浜画像認識AI 高品質な体験を磨き込むData-Centricな開発の実践

802 Views

June 02, 26

スライド概要

没入型体験施設「ワンダリア横浜」では、画像認識AIを用いた「ワンダリアアプリ」が体験の中核を担っています。本資料ではオンデバイスでの高速かつ高品質な認識体験を実現した開発の裏側を紹介します。

鈴木達哉
DeNA × AI Talks #8 事業に活かす画像認識AIの開発舞台裏 スポーツからエンタメまで
https://dena.connpass.com/event/393626/

profile-image

DeNA が社会の技術向上に貢献するため、業務で得た知見を積極的に外部に発信する、DeNA 公式のアカウントです。DeNA エンジニアの登壇資料をお届けします。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

(ダウンロード不可)

関連スライド

各ページのテキスト
1.

ワンダリア横浜画像認識AI 高品質な体験を磨き込むData-Centricな開発の実践 2026/5/22 DeNA × AI Talks #8 鈴木達哉 株式会社ディー・エヌ・エー © DeNA Co., Ltd. 1

2.

自己紹介 鈴木達哉 / Suzuki Tatsuya AI技術開発部ビジョン・スポーツグループ ● 2020.4 ~ DeNA AIエンジニア ○ ドライブレコーダー映像の画像認識 ○ 各種コンピュータビジョン案件 ● 2025.1 「Data-centric AI入門」(共著、技術評論社) ● 2025.4 ~ ワンダリア横浜リードAIエンジニア © DeNA Co., Ltd. 2

4.

映像×アプリで楽しむ没⼊型体験施設「ワンダリア横浜」 ● 四季の高原や神秘的な深海など6ゾーンの臨場感あるデジタル映像 ● スマホをかざすと70種類以上の生き物を瞬時に認識しコレクション ミッションあり ゲーム感覚で 館内を巡る スマホを かざして発見 Tipsを入手 ・コレクション 画像認識AIが体験のコアになっている事業 © DeNA Co., Ltd. 4

5.

⼀⾒、ワンダリア横浜の画像認識AIはかなりシンプルなタスク? 聞こえてきそうなこんな声... 映像を物体検出しているだけ アノテーションして学習するだけ アノテーションして物体検出器(YOLOX)を学習しているのはそれはそう 事業として最高の体験を 創り込むにはそれだけじゃない © DeNA Co., Ltd. 5

6.

最⾼の体験のためのこだわり 映像 × アプリの 体験磨き込み オンデバイスで 高速推論 高精度認識 技術面でのオンデバイスでの高精度認識を土台に、体験の磨き込みを重視 映像にスマホをかざすとサクサク正確に認識し、それにより楽しい体験を実現 © DeNA Co., Ltd. 6

7.

体験を磨く⾼速検証サイクル 最新映像を 学習 AI学習 モデルを デプロイ 施設完成前はオフィスで 仮映像による検証 映像 アプリ UX検証 開発初期から開業直前まで 高速に検証を回し続けた © DeNA Co., Ltd. 施設完成後は現地で 実映像による検証 7

8.

⾼精度&⾼速検証サイクルを可能にした3つの要素 ①Data-Centric AI ②システム設計 ③チーム連携 © DeNA Co., Ltd. 8

9.

①⾼精度&⾼速検証のためのData-Centric AI Model-Centric AI (モデル中心のAI開発) ● データを固定 ● 機械学習モデルを改善 Data-Centric AI (データ中心のAI開発) ● 機械学習モデルを固定 ● データを改善 ワンダリアアプリの場合は ● オンデバイスのため量子化などでモデル調整は時間がかかる ● 独自のCG映像の画像認識故にデータ作りはかならず発生 モデルも大事だが、データをどう作るかがすごく重要 © DeNA Co., Ltd. 9

10.

①Data-Centric AI:SAM 3活⽤内製アノテーションツール ● タスク特性にあわせたツールを内製(Label Studioを拡張) ● SAM 3(Meta社開発の強力AIモデル)活用で時間激減 ● ある範囲では1700時間→75時間 詳細は次の発表「SAM 3 × アノテーション — ワンダリアの画像認識AIを支える基盤作り」で! © DeNA Co., Ltd. 10

11.

①Data-Centric AI:必要⼗分なデータ品質 前提: 品質が高いほど精度向上 SAM 3出力をどこまで手修正するか。時間と推論結果を比較 A: SAM 3そのまま © DeNA Co., Ltd. B: データFPを 削除 C: 大きな D: データFN部分の E: 細かな Bboxズレを修正 Bbox追加 Bboxズレを修正 11

12.

①Data-Centric AI:必要⼗分なデータ品質 前提: 品質が高いほど精度向上 SAM 3出力をどこまで手修正するか。時間と推論結果を比較 方法 修正時間 推論 推論 FP FN メモ A. SAM3出力そのまま - ✖ ✖ さすがに使えない B. データFPを削除 79分 △ ✖ 作業は楽。見逃し気になる C. B + 大きなBboxズレ修正 95分 ⚪ △ まだ見逃し気になる D. C + データ FN部分の Bbox追加 152分 ⚪ ⚪ 見逃しなくなる 採用 E. D + 細かいBboxズレ修正 200分以上 ⚪ ⚪ Eとほぼ変わらず時間もったいない 結論:クラスは正確に・FP & FNはNG・Bboxの細かいズレはOK なお、初期からBboxを描画しないUIを提案。たとえ推論のBboxがズレても気にならない状態も作っていた © DeNA Co., Ltd. 12

13.

①Data-Centric AI:必要⼗分なデータ量 前提: 量が増えるほど精度向上 投影映像を撮影し学習。どんな撮影がどれだけ必要かを実験 異なる角度からの撮影を模倣するデータ拡張も導入 スクリーン ② ③ ① スクリーン前で一定間隔で定点撮影 (実際はもっと細かく撮影し実験) 方法 精度 A. 正面① △ B. 正面① + データ拡張 ⚪ 体験上十分 採 用 C. 正面① + 左② + データ拡張 ◎ D. 正面① + 左右②③ + データ拡張 ◎ 結論:正面から定点で1本撮影しデータ拡張すればまずOK 精度足りない部分があれば左右からの映像や、近寄った映像を足していく方針に © DeNA Co., Ltd. 13

14.

【特許出願済み】 ②⾼精度&⾼速検証のためのシステム設計 ● 今いるゾーンをヤマハ株式会社のSoundUD技術で識別 ● ゾーンごとのモデルを選択 ● 今映っている生き物のリストを取得しフィルタリング ゾーン識別SoundUDトリガー (人間には聴こえない音波) 今いるゾーン 画像認識モデル (YOLOX) 映像 ゾーン 1 選択 スピーカー © DeNA Co., Ltd. 選択 今いるゾーンの 映像配信装置 今映っている生き物リスト 認識結果 フィルタリングされた 最終出力 14

15.

②システム設計:ゾーンごとにモデルを分割 ゾーンが識別できるので各ゾーンのモデルは分割 ● ゾーンに存在しない生き物の誤認識がなくなる ● あるゾーンの映像変更時、他ゾーンへの精度影響を無視できる ● データセット規模が小さくなり学習時間が短縮 高精度&高速検証どちらにも寄与! ゾーン識別SoundUDトリガー (人間には聴こえない音波) 選択 ゾーン 1 今いるゾーン 画像認識モデル (YOLOX) スピーカー © DeNA Co., Ltd. 15

16.

②システム設計:今映っている⽣き物リストを取得 映像配信装置から今映っている生き物のリストを取得 ● 画像認識結果をルールベースでフィルタリングが可能 ● 登場していない生き物の誤検出はカット ➔ Precision向上 ● Confidence閾値を下げられる ➔ Recall向上 特に高精度化に寄与! ゾーン識別SoundUDトリガー (人間には聴こえない音波) スピーカー © DeNA Co., Ltd. 選択 ゾーン 1 今いるゾーンの 映像配信装置 (今映っている 生き物リストを送信) 16

17.

②システム設計:⽣き物リストを使い「画像認識しない」ことも ● 映像美を優先すると画像認識が難しい場面も出てくる ● 今いる生き物リストがあれば、画像認識せずにも判定は可能 ● 例えば洞窟の中のホタル・イワシの大群などに適用 映像体験第一と考えると、こういった美しい場面を画像認識のために修正したくない © DeNA Co., Ltd. 17

18.

③⾼精度&⾼速検証のためのチーム連携 ● 連携しあい開発・検証を進める ● お互いの専門性を尊重し助け合う風通しの良いカルチャー ● 開業前はなんとほぼ全員でアノテーション AI アプリ 映像 QA 施設 事業部 © DeNA Co., Ltd. 各チームがフラットに連携 18

19.

③チーム連携:関係者ほぼ全員でのアノテーション ● 開業前はより一層検証サイクルを高速化したい ● 映像×アプリ体験向上は関係者共通の目標 ● AIエンジニア&専門アノテーションチームに加え、アプリの エンジニア・PM・そしてビジネスメンバーもほぼ全員参加 超高速サイクルを実現: 朝に新映像 ➔ 午後アノテーション ➔ 夜間に学習回す ➔ 朝検証 副次効果:みんなが動画やアプリにより詳しくなり改善が捗る © DeNA Co., Ltd. 19

20.

体験を磨き込んで完成した「ワンダリア横浜」 ● 画像認識AIがコアに活きる事業 ● 体験を磨くための高速な検証ループ ● モデルに加えデータ・システム設計・チーム連携を重視 SAM 3ツール開発は最重要ポイント 詳細は次の新卒2年目孫さんの発表で! © DeNA Co., Ltd. 3月発表、アプリリードエンジニア菊地さんによる 生成AIを全力活用したアプリ開発の話もぜひ 20

21.

© DeNA Co., Ltd. 21