---
title: ワンダリア横浜画像認識AI 高品質な体験を磨き込むData-Centricな開発の実践
tags:  #dena ai talks  
author: [DeNA_Tech](https://docswell.com/user/DeNA_Tech)
site: [Docswell](https://www.docswell.com/)
thumbnail: https://bcdn.docswell.com/page/VJNYNXZM78.jpg?width=480
description: 没入型体験施設「ワンダリア横浜」では、画像認識AIを用いた「ワンダリアアプリ」が体験の中核を担っています。本資料ではオンデバイスでの高速かつ高品質な認識体験を実現した開発の裏側を紹介します。  鈴木達哉 DeNA × AI Talks #8 事業に活かす画像認識AIの開発舞台裏 スポーツからエンタメまで https://dena.connpass.com/event/393626/
published: June 02, 26
canonical: https://docswell.com/s/DeNA_Tech/57NJPW-2026-06-02-173351
---
# Page. 1

![Page Image](https://bcdn.docswell.com/page/VJNYNXZM78.jpg)

ワンダリア横浜画像認識AI
高品質な体験を磨き込むData-Centricな開発の実践
2026/5/22 DeNA × AI Talks #8
鈴木達哉
株式会社ディー・エヌ・エー
© DeNA Co., Ltd.
1


# Page. 2

![Page Image](https://bcdn.docswell.com/page/YE9PR8ZWJ3.jpg)

自己紹介
鈴木達哉 / Suzuki Tatsuya
AI技術開発部ビジョン・スポーツグループ
● 2020.4 ~ DeNA AIエンジニア
○ ドライブレコーダー映像の画像認識
○ 各種コンピュータビジョン案件
● 2025.1 「Data-centric AI入門」（共著、技術評論社）
● 2025.4 ~ ワンダリア横浜リードAIエンジニア
© DeNA Co., Ltd.
2


# Page. 3

![Page Image](https://bcdn.docswell.com/page/GE8DW81RED.jpg)

3


# Page. 4

![Page Image](https://bcdn.docswell.com/page/LELMNRQ27R.jpg)

映像×アプリで楽しむ没⼊型体験施設「ワンダリア横浜」
● 四季の高原や神秘的な深海など6ゾーンの臨場感あるデジタル映像
● スマホをかざすと70種類以上の生き物を瞬時に認識しコレクション
ミッションあり
ゲーム感覚で
館内を巡る
スマホを
かざして発見
Tipsを入手
・コレクション
画像認識AIが体験のコアになっている事業
© DeNA Co., Ltd.
4


# Page. 5

![Page Image](https://bcdn.docswell.com/page/4JMYXR19JW.jpg)

⼀⾒、ワンダリア横浜の画像認識AIはかなりシンプルなタスク？
聞こえてきそうなこんな声...
映像を物体検出しているだけ
アノテーションして学習するだけ
アノテーションして物体検出器（YOLOX）を学習しているのはそれはそう
事業として最高の体験を
創り込むにはそれだけじゃない
© DeNA Co., Ltd.
5


# Page. 6

![Page Image](https://bcdn.docswell.com/page/PJR9NRL979.jpg)

最⾼の体験のためのこだわり
映像 × アプリの
体験磨き込み
オンデバイスで
高速推論
高精度認識
技術面でのオンデバイスでの高精度認識を土台に、体験の磨き込みを重視
映像にスマホをかざすとサクサク正確に認識し、それにより楽しい体験を実現
© DeNA Co., Ltd.
6


# Page. 7

![Page Image](https://bcdn.docswell.com/page/PEXQNRW3JX.jpg)

体験を磨く⾼速検証サイクル
最新映像を
学習
AI学習
モデルを
デプロイ
施設完成前はオフィスで
仮映像による検証
映像
アプリ
UX検証
開発初期から開業直前まで
高速に検証を回し続けた
© DeNA Co., Ltd.
施設完成後は現地で
実映像による検証
7


# Page. 8

![Page Image](https://bcdn.docswell.com/page/3EK9NRVNED.jpg)

⾼精度＆⾼速検証サイクルを可能にした3つの要素
①Data-Centric AI
②システム設計
③チーム連携
© DeNA Co., Ltd.
8


# Page. 9

![Page Image](https://bcdn.docswell.com/page/L73WV8MZ75.jpg)

①⾼精度＆⾼速検証のためのData-Centric AI
Model-Centric AI
（モデル中心のAI開発）
● データを固定
● 機械学習モデルを改善
Data-Centric AI
（データ中心のAI開発）
● 機械学習モデルを固定
● データを改善
ワンダリアアプリの場合は
● オンデバイスのため量子化などでモデル調整は時間がかかる
● 独自のCG映像の画像認識故にデータ作りはかならず発生
モデルも大事だが、データをどう作るかがすごく重要
© DeNA Co., Ltd.
9


# Page. 10

![Page Image](https://bcdn.docswell.com/page/87DK8M64JG.jpg)

①Data-Centric AI：SAM 3活⽤内製アノテーションツール
● タスク特性にあわせたツールを内製（Label Studioを拡張）
● SAM 3（Meta社開発の強力AIモデル）活用で時間激減
● ある範囲では1700時間→75時間
詳細は次の発表「SAM 3 × アノテーション — ワンダリアの画像認識AIを支える基盤作り」で！
© DeNA Co., Ltd.
10


# Page. 11

![Page Image](https://bcdn.docswell.com/page/VJPK8RYVE8.jpg)

①Data-Centric AI：必要⼗分なデータ品質
前提：
品質が高いほど精度向上
SAM 3出力をどこまで手修正するか。時間と推論結果を比較
A: SAM 3そのまま
© DeNA Co., Ltd.
B: データFPを
削除
C: 大きな
D: データFN部分の
E: 細かな
Bboxズレを修正
Bbox追加
Bboxズレを修正
11


# Page. 12

![Page Image](https://bcdn.docswell.com/page/2EVVNRGREQ.jpg)

①Data-Centric AI：必要⼗分なデータ品質
前提：
品質が高いほど精度向上
SAM 3出力をどこまで手修正するか。時間と推論結果を比較
方法
修正時間
推論
推論
FP
FN
メモ
A. SAM3出力そのまま
-
✖
✖
さすがに使えない
B. データFPを削除
79分
△
✖
作業は楽。見逃し気になる
C. B + 大きなBboxズレ修正
95分
⚪
△
まだ見逃し気になる
D. C + データ FN部分の Bbox追加
152分
⚪
⚪
見逃しなくなる 採用
E. D + 細かいBboxズレ修正
200分以上
⚪
⚪
Eとほぼ変わらず時間もったいない
結論：クラスは正確に・FP &amp; FNはNG・Bboxの細かいズレはOK
なお、初期からBboxを描画しないUIを提案。たとえ推論のBboxがズレても気にならない状態も作っていた
© DeNA Co., Ltd.
12


# Page. 13

![Page Image](https://bcdn.docswell.com/page/57GLKM86EL.jpg)

①Data-Centric AI：必要⼗分なデータ量
前提：
量が増えるほど精度向上
投影映像を撮影し学習。どんな撮影がどれだけ必要かを実験
異なる角度からの撮影を模倣するデータ拡張も導入
スクリーン
②
③
①
スクリーン前で一定間隔で定点撮影
（実際はもっと細かく撮影し実験）
方法
精度
A. 正面①
△
B. 正面① + データ拡張
⚪ 体験上十分 採
用
C. 正面① + 左② + データ拡張
◎
D. 正面① + 左右②③ + データ拡張
◎
結論：正面から定点で1本撮影しデータ拡張すればまずOK
精度足りない部分があれば左右からの映像や、近寄った映像を足していく方針に
© DeNA Co., Ltd.
13


# Page. 14

![Page Image](https://bcdn.docswell.com/page/4EQYNR92JP.jpg)

【特許出願済み】
②⾼精度＆⾼速検証のためのシステム設計
● 今いるゾーンをヤマハ株式会社のSoundUD技術で識別
● ゾーンごとのモデルを選択
● 今映っている生き物のリストを取得しフィルタリング
ゾーン識別SoundUDトリガー
（人間には聴こえない音波）
今いるゾーン
画像認識モデル
(YOLOX)
映像
ゾーン
1
選択
スピーカー
© DeNA Co., Ltd.
選択
今いるゾーンの
映像配信装置
今映っている生き物リスト
認識結果
フィルタリングされた
最終出力
14


# Page. 15

![Page Image](https://bcdn.docswell.com/page/KJ4WG8XP71.jpg)

②システム設計：ゾーンごとにモデルを分割
ゾーンが識別できるので各ゾーンのモデルは分割
● ゾーンに存在しない生き物の誤認識がなくなる
● あるゾーンの映像変更時、他ゾーンへの精度影響を無視できる
● データセット規模が小さくなり学習時間が短縮
高精度＆高速検証どちらにも寄与！
ゾーン識別SoundUDトリガー
（人間には聴こえない音波）
選択
ゾーン
1
今いるゾーン
画像認識モデル
(YOLOX)
スピーカー
© DeNA Co., Ltd.
15


# Page. 16

![Page Image](https://bcdn.docswell.com/page/LE1YD2NX7G.jpg)

②システム設計：今映っている⽣き物リストを取得
映像配信装置から今映っている生き物のリストを取得
● 画像認識結果をルールベースでフィルタリングが可能
● 登場していない生き物の誤検出はカット ➔ Precision向上
● Confidence閾値を下げられる ➔ Recall向上
特に高精度化に寄与！
ゾーン識別SoundUDトリガー
（人間には聴こえない音波）
スピーカー
© DeNA Co., Ltd.
選択
ゾーン
1
今いるゾーンの
映像配信装置
（今映っている
生き物リストを送信）
16


# Page. 17

![Page Image](https://bcdn.docswell.com/page/GEWGYR4KJ2.jpg)

②システム設計：⽣き物リストを使い「画像認識しない」ことも
● 映像美を優先すると画像認識が難しい場面も出てくる
● 今いる生き物リストがあれば、画像認識せずにも判定は可能
● 例えば洞窟の中のホタル・イワシの大群などに適用
映像体験第一と考えると、こういった美しい場面を画像認識のために修正したくない
© DeNA Co., Ltd.
17


# Page. 18

![Page Image](https://bcdn.docswell.com/page/47ZLXR2NJ3.jpg)

③⾼精度＆⾼速検証のためのチーム連携
● 連携しあい開発・検証を進める
● お互いの専門性を尊重し助け合う風通しの良いカルチャー
● 開業前はなんとほぼ全員でアノテーション
AI
アプリ
映像
QA
施設
事業部
© DeNA Co., Ltd.
各チームがフラットに連携
18


# Page. 19

![Page Image](https://bcdn.docswell.com/page/YJ6W4RV9JV.jpg)

③チーム連携：関係者ほぼ全員でのアノテーション
● 開業前はより一層検証サイクルを高速化したい
● 映像×アプリ体験向上は関係者共通の目標
● AIエンジニア＆専門アノテーションチームに加え、アプリの
エンジニア・PM・そしてビジネスメンバーもほぼ全員参加
超高速サイクルを実現：
朝に新映像 ➔ 午後アノテーション ➔ 夜間に学習回す ➔ 朝検証
副次効果：みんなが動画やアプリにより詳しくなり改善が捗る
© DeNA Co., Ltd.
19


# Page. 20

![Page Image](https://bcdn.docswell.com/page/GJ5MQ8DDJ4.jpg)

体験を磨き込んで完成した「ワンダリア横浜」
● 画像認識AIがコアに活きる事業
● 体験を磨くための高速な検証ループ
● モデルに加えデータ・システム設計・チーム連携を重視
SAM 3ツール開発は最重要ポイント
詳細は次の新卒2年目孫さんの発表で！
© DeNA Co., Ltd.
3月発表、アプリリードエンジニア菊地さんによる
生成AIを全力活用したアプリ開発の話もぜひ
20


# Page. 21

![Page Image](https://bcdn.docswell.com/page/LE3WVGQQE5.jpg)

© DeNA Co., Ltd.
21


