修士論文発表資料

バスODデータ自動取得に向けた BLEアドバタイジング・パケットのスマートフォン所持者の行動を考慮したバス車内外分類吉原新太情報基盤システム学研究室

1 研究背景: 効率的な運行サービスのためのバスODデータ • バス事業の現状[1] • 地方部を中心にバスドライバー不足が深刻化 • 運転業務に対する低い賃金水準バスサービス提供者は少ない人員で効率の良い運行サービスへの改善が課題 • 利用者の減少 • コロナウイルスの影響 • 地方部の過疎化等々 • ODデータを活用した運行計画改善[2] 停留所 01_A 02_B 01_A 03_C 2 04_D 3 1 6 8 9 0 3 2 • OD(Origin Destination)データ: 02_B 2 乗降者が乗車・降車したバス停を表す表データ • 人力による取得→人件コストが高い 03_C 9 3 04_D 5 3 1 05_E 4 7 7 • 少ないコストで自動取得することを検討 1. 国土交通省, “地域の公共交通を取り巻く現状と検討の視点・課題”，https://www.mlit.go.jp/sogoseisaku/transport/content/001728295.pdf，Sep. 2023 2. 中部運輸局, “バスデータ活用大百科”, https://wwwtb.mlit.go.jp/kanto/content/000166077.pdf, Mar. 2020 05_E ODデータのイメージ 9 3

3.

研究背景: ODデータの自動取得方法 2 • ICカードによる取得各手法の比較 • ICカードの情報を使えない場合が多い • ICカード業者から購入する必要性 ICカードカメラ（備え付け） MACアドレスコスト × × ◯ 時間帯 ◯ △ ◯ 人数の影響 ◯ × △ 車外の影響 ◯ ◯ × • タッチ決済の場合乗車または降車情報のみ • カメラによる取得 • 備え付けの低解像度監視カメラを使用 • MLモデルを使用すると高コスト • 人同士が重なると性能低下 • MACアドレスの追跡による手法 • 汎用的かつ低コストで使用可能 • MACアドレスのランダム化により追跡が難しい本研究ではコスト面・汎用面から MACアドレスの追跡による手法に着目

4.

想定するパケットの検討 • 先行研究で使用されていたパケット • Wi-Fiのプローブリクエスト • 送信間隔が数秒〜数分と長く, MACアドレスランダム化が頻繁に発生 • BLEアドバタイジング・パケット: COCOA（新型コロナウイルス接触確認アプリ[3]） • 現在運用停止につき使用不可 • 今回使用するパケット: 以下のBLEアドバタイジング・パケット • Find My[4]（iOSの「デバイスを探す」機能） • 送信間隔: およそ2秒 • MACアドレスランダム化の頻度: 数分〜数十分 • Google LLCのパケット（Googleアカウントでログイン済みのAndroidデバイスで確認） • 送信間隔: およそ0.3秒 • MACアドレスランダム化の頻度: 数分〜十数分 3. 厚生労働省, “新型コロナウイルス接触確認アプリ (COCOA) COVID-19 Contact-Confirming Application”, https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/cocoa_00138.html 4. A. Heinrich, M. Stute, T. Kornhuber, and M. Hollick, "Who Can Find My Devices? Security and Privacy of Apple's Crowd-Sourced Bluetooth Location Tracking System," in Proceedings on Privacy Enhancing Technologies, vol. 2021, no. 3, pp. 227-245, 2021. 3

https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/cocoa_00138.html

5.

本研究で想定するバスのODデータ推定方法 4 • ODデータ推定のプロセスは大きく以下の三つランダム化された MACアドレスを紐付け BLEアドバタイジング・パケットを収集 • イメージ紐付け 00:00:5e:00:53:00 乗車時刻表と突合し ODデータ推定紐付け 00:00:5e:00:53:05 同じデバイスの MACアドレス・出現したタイミング: 乗車・消失したタイミング: 降車としてODデータを推定 00:00:5e:00:53:03 降車

6.

ODデータ推定における課題 • バス車外のデバイスのBLEアドバタイジング・パケットがノイズ • 歩行者のデバイスのBLEアドバタイジング・パケット • 自動車のデバイスのBLEアドバタイジング・パケット etc. • ノイズが増えることにより, 同一デバイスのMACアドレス紐付けが困難になる • ノイズを可能な限り減らし, 乗客のMACアドレスのみで紐付けることが理想 MACアドレスをバス車内外に分類し, ノイズを可能な限り減らしたい 5

7.

バス車内外分類の研究: 時間情報を使用した手法[5] 6 • MACアドレスの出現時間が閾値以上か未満でバス車内外に分類歩行者や自動車といった短時間しか現れないMACアドレスの除去に有効一部バス車外の自動車, 歩行者の行動を考慮し切れていない • 信号で停止する自動車 • バス停でバスを待っている人etc. MAC addr4 車外 MAC addr3 車内 MAC addr2 車外 MAC addr1 車外 0秒 50秒出現時間 (秒) 分類方法のイメージ図 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022.

8.

バス車内外分類の研究: RSSIを使用した手法[6] 7 • バス車内外のパケットを取得し, 平均RSSI, 出現時間の閾値でバス車内外に分類 F1スコア75%でリアルタイムにバス車内人数を推定 • スニファーの位置 • スニファー: • パケットを採取するソフトウェア/ハードウェア • バス車内の配置 etc. RSSI (dBm) RSSIに関して車内環境に合わせた閾値設定が必要 90秒 MAC addr2 車内 MAC addr3 MAC addr1 -40dBm 車内 -60dBm 車外出現時間 (秒) 分類方法のイメージ図 6. T. Oransirikul, I. Piumarta, and H. Takada, "Classifying passenger and non-passenger signals in public transportation by analysing mobile device Wi-Fi activity," Journal of Information Processing, vol. 27, pp. 25-32, 2019.

9.

研究目的と課題 • 目的: 汎用的かつ高性能なバス車内外分類手法の開発 • 課題: スマートフォン所有者の行動を考慮した汎用的な方法の考案 • バスやスニファーの設置位置といったRSSIに関して車内環境に依存した値を使用しない • 車内環境に応じたRSSIの閾値設定不要 • バス車内外の状況を考慮 • スマートフォンを持つ歩行者/自動車の挙動 8

10.

既存路線で取得したバス車内外のデータ分析 9 • 中鉄バス国立病院線[7]で収集されたデータ (路線バスデータ) をもとに, バス車内外にRSSI/送信時間にどのような傾向を持つデータがあるか調査 • 岡山大の研究チームが収集したデータを利用させていただいた • バスODデータ推定を目的として収集されたデータ • 中鉄バス国立病院線: • 走行距離: 10km程度 • バス停数: およそ30 • 3つの便 (片道) のデータを使用 • 8時25分天満屋発 • 14時30分天満屋発 • 17時37分天満屋発 7. 中鉄バス株式会社, “路線バス国立病院線”, http://www.chutetsu-bus.co.jp/rosen/kokuritu.html

http://www.chutetsu-bus.co.jp/rosen/kokuritu.html

11.

MACアドレスが変わっていないパターン (iOS) 10 赤点線: バス停に着いた時刻青点線: バス停を出発した時刻 • 全ての便でMACアドレスが同じものを確認 • 乗客のRSSI/送信間隔のパターンと定義 • 以降で乗客と比較して特徴的な傾向を示すMACアドレスの例を図示 • RSSIのばらつきが大きいため, 前後5秒間の移動平均を計算し図示 8時25分の便で見られた共通のMACアドレスのデータ

12.

確認できた特徴的なパターン • 非常に短い期間で出現 • バス停停車期間内のみ出現 • パターンに対する仮説: • パターンに対する仮説: 例: 車道で追い越してきた自動車例: バス停で他のバスを待つ歩行者 11 • 間欠的な動き • 一度MACアドレスが出現したのち, 時間を空けて再出現 • パターンに対する仮説: 例: 一度バスを追い越し, 信号等によりバスに追いつかれた自動車出現時間が短いパターンの例バス停停車期間内のみ受信できたパターンの例間欠的な動きをしているパターンの例

13.

提案手法 12 • 仮説をもとにバス車内外分類アルゴリズムを作成 • 閾値を以下で設定 • 時間情報（バスの停車時間情報/速度情報含む） • BLEアドバタイジング・パケットの仕様 • 以下のいずれかに当てはまるものを車外に分類 1. 出現時間が短いパターン 2. バス停停車期間内のみ受信できたパターン 3. 間欠的な動きをしているパターン BLEアドバタイジング・パケット車外車外 60秒未満 60秒以上出現時間バス停停車期間±10秒内出現期間 iOS バス停停車期間±10秒外 Android OS 車内車外 Yes パケット受信間隔中央値≦15秒 AND 最大間隔≧15秒 No 車内

14.

評価用データセットの作成 • 路線バスデータはバス車内/車外のラベル無し • バス車内外の任意のデータを作成し, ラベル付された評価用データセットを作成 • 実験A (奈良先端大のS3教室とその周辺環境で実施した実験) • 実験B (実際に使用されているバスを使用して実施した実験) 13

15.

データセットの作成方法 • データセットはスマートフォンを所持した人が動くことで作成 • バスは動かすことができない→被験者側がバスと歩行者/自動車との相対的な動きをする • 相対的な速さは「歩く/走る」で再現 • 例: バス停車時にバス停で待っている人を再現したい時本来の挙動実験での再現方法 14

16.

実験A: 奈良先端大学内で実施した実験 • 奈良先端大のS3教室 (共用ゼミ室3) をバス, その周辺環境を歩道・車道と見立て実験 • 15 進行方向(仮定) 教室の右側がガラス窓, 他3面がコンクリート壁 • バス車内の環境に類似教室内料金箱 • 事前に設定したスケジュール通りにスマートフォン(iOS/Android)を所持した被験者が行動 • 実験で設定した観測対象 • • バス停に留まっている歩行者バスが停まっている時に歩道を通る歩行者 • バスが停まっている時にバスの前を横切る歩行者バスを追い越す自動車 • • • • 歩バスを追い越したのち, 信号で再度合流する自動車使用したスマートフォン(実験A/B共通) 並走車乗客機種名 OSバージョン • • • • 料金箱へ移動席を移動乗車降車 Android iOS Pixel 4a 13 iPhone SE2 18.1.1 iPhone 15 Pro スニファー車 60cm 60cm S3 教室道スニファー 60cm 道スニファー後 17.6.0 17.4.1 前実験Aの環境

17.

実験B: 実際のバスを使用した実験 16 進行方向(仮定) • 奈良交通株式会社の北大和営業所の一部とバス一台を借りることで実験環境を用意バス車内 • バス前出口 • 実際の運行で使用されている全長11mのもの • 実験A同様, 事前に設定したスケジュール通りにスマートフォン(iOS/Android)を所持した被験者が行動スニファー歩車 • 実験で設定した観測対象 • バスを追い越したのち, 信号で再度合流する自動車 • 並走車 • 乗客 • 料金箱へ両替のために移動 • 席を移動 • 乗車 • 降車入口バス道スニファー道スニファー後実験Bの環境

18.

データセットの評価 17 • 定性的な観点から, 実験A/Bで収集したデータセットが仮説通りのパターンになっているか評価 • 評価方法: • 路線バスデータと比較し, パターン通りの動きと言えるか確認 • 以降で実験A/B, 路線バスデータの比較結果について述べる

19.

取得したデータの分析: 間欠的な動きをしているパターン(iOS) • 設定した観測対象の中で以下が該当 18 ※実験Bではバス車外のiPhoneがFind Myパケットを送信していなかったため, 同様に追跡可能な別のパケットを使用する • バスを追い越したのち, 信号等で再度合流する自動車 (実験A/B) • 実データと比較 • バス路線で収集したデータと同じような挙動であることを確認 • 再出現までに一定期間空いている実験A: 間欠的な動きをする自動車のパターン実験B: 間欠的な動きをする自動車のパターン路線バスデータのパターン3 • これ以外の車外パターンも路線バスデータと同じような挙動であることを確認

20.

取得したデータの分析: 乗車中の乗客 (iOS) 19 • 設定した観測対象の中で以下が該当 • 乗客 (実験A/B) • 実データと比較 • バス路線で収集したデータと同じような挙動であることを確認 • 一部RSSIの上下はあるものの受信が止まるような部分は見られなかった座席の移動料金箱へ移動料金箱へ移動座席の移動実験A: 乗客のパターン実験B: 乗客のパターンバス路線データの乗客と思われるパターン

21.

取得したデータの分析: 乗車中の乗客 (Android) 20 • RSSIが小さく, 車外のデータは基本的に受信していなかった • 実験Aでは乗客のみ, 実験Bでは乗客と並走車が受信できていた • 乗客はRSSIが小さいことから途中で受信が途切れる場面も見られた • Androidは「間欠的なパターン」を車外として分類すべきでない座席の移動料金箱へ移動座席の移動料金箱へ移動実験A: 乗客のパターン実験B: 乗客のパターン

22.

車内外分類性能の評価 21 • MACアドレスによるバス車内外分類の性能評価 • 適合率・再現率・F1スコアで評価 • バス非利用者の車外分類精度を検証 • 評価に使用する実験データ (最前席に設置したスニファーのデータ) • 実験A：ラベル付きデータの1パターン • 実験B：ラベル付きデータと全車外デバイス (対象外デバイス) を含めた2パターン • 既存手法との性能比較 • Kawashimaらの手法[5] • Oransirikulらの手法[6] • 車内のMACアドレスを確実に車内に分類できることを重視 • 適合率は100%が前提 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022. 6. T. Oransirikul, I. Piumarta, and H. Takada, "Classifying passenger and non-passenger signals in public transportation by analysing mobile device Wi-Fi activity," Journal of Information Processing, vol. 27, pp. 25-32, 2019.

23.

評価結果: 実験Aのデータセットに対するバス車内外分類 • Androidは車外MACアドレスがないため評価しない • 22 MACアドレスの内訳 iOS 提案手法による車内分類は全て成功 • 提案手法が最も高い分類性能を達成 (適合率/F1スコア) Android 車内 7 11 車外 6 0 • 車内分類は全て成功 • 提案手法でバス車外に分類できたパターン • • • 歩行者 (3パターン全て) バスを追い越した自動車並走車 (一部) • 提案手法でバス車外に分類できなかったパターン • • 実験Aのデータセットに対する分類結果手法再現率適合率 F1スコア Oransirikulら[6](RSSIの閾値調整無し) 1.000 0.636 0.778 Kawashimaら[5] 0.429 1.000 0.600 提案手法 0.714 1.000 0.833 並走車 (一部) 間欠的な動きをする自動車 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022. 6. T. Oransirikul, I. Piumarta, and H. Takada, "Classifying passenger and non-passenger signals in public transportation by analysing mobile device Wi-Fi activity," Journal of Information Processing, vol. 27, pp. 25-32, 2019.

24.

23 評価結果: 実験Bのデータセットに対するバス車内外分類 MACアドレスの内訳 iOS Android • iOSにおいて乗客の分類に全て成功した上で高いF1スコアを達成車内 7 11 • RSSIの閾値調整済み手法と同程度車外 6 2 • 対して, Androidの分類は失敗 • Androidは並走車の動きをしており, 提案手法で車外に分類することは困難実験Bのデータセットに対する分類結果再現率適合率 F1スコア 1.000 0.857 0.923 0.500 1.000 0.667 0.333 1.000 0.500 提案手法 0.500 1.000 0.667 Oransirikulら[6] (RSSIの閾値調整無し) 1.000 0.154 0.267 0.000 - - 0.000 - - 0.000 - - 手法 Oransirikulら[6] (RSSIの閾値調整無し) Oransirikulら[6] (RSSIの閾値調整あり) • 提案手法でバス車外に分類できたパターン (iOS) • 間欠的な動きをする自動車 • 提案手法でバス車外に分類できなかったパターン • 並走車 OS Kawashimaら[5] Oransirikulら[6] (RSSIの閾値調整あり) Kawashimaら[5] 提案手法 iOS Android 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022. 6. T. Oransirikul, I. Piumarta, and H. Takada, "Classifying passenger and non-passenger signals in public transportation by analysing mobile device Wi-Fi activity," Journal of Information Processing, vol. 27, pp. 25-32, 2019.

25.

評価結果: 実験Bのデータセット+対象外デバイスを含めたバス車内外分類 24 MACアドレスの内訳 iOS • 出現時間の閾値を使用する場合と比較して分類性能向上を確認 • RSSIを使った手法に比べ性能が低下 • バスが動いておらず, 営業所にいた従業員の方や周りに滞在していた人の車外分類に失敗したと考えられる Android 車内 7 11 車外 279 285 実験Bのデータセット+対象外デバイスを含めたデータに対する分類結果再現率適合率 F1スコア 1.000 0.996 0.998 0.989 1.000 0.995 0.814 1.000 0.897 提案手法 0.839 1.000 0.912 Oransirikulら[6] (RSSIの閾値調整無し) 1.000 0.963 0.981 0.891 1.000 0.942 0.881 1.000 0.937 0.884 1.000 0.939 手法 OS Oransirikulら[6] (RSSIの閾値調整無し) Oransirikulら[6] (RSSIの閾値調整あり) Kawashimaら[5] Oransirikulら[6] (RSSIの閾値調整あり) Kawashimaら[5] 提案手法 iOS Android 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022. 6. T. Oransirikul, I. Piumarta, and H. Takada, "Classifying passenger and non-passenger signals in public transportation by analysing mobile device Wi-Fi activity," Journal of Information Processing, vol. 27, pp. 25-32, 2019.

26.

25 考察: 車外のパターンが意図していない分類だったもの車外に分類できていなかった・送信間隔の最大値: 138.4秒・送信間隔の中央値: 26.1秒 2つ中1つのMACアドレスがで車外に分類・送信間隔の最大値: 16.0秒・送信間隔の中央値: 2.0秒 BLEアドバタイジング・パケット車外間欠的な動きをする自動車並走車車外 60秒未満 60秒以上出現時間バス停停車期間±10秒内出現期間バスとの距離が7mと実際の距離より離れており, パケットが受信しにくい状況だった可能性 → のみ車外に分類できるはずがでも分類できていた・送信間隔の最大値: 18.0秒・送信間隔の中央値: 4.0秒歩道側ではなく車道側で動きを再現したため, バス停に留まっている歩行者上記と同様の問題が発生していた可能性 iOS バス停停車期間±10秒外 Android OS 車内車外 Yes パケット受信間隔中央値≦15秒 AND 最大間隔≧15秒 No 車内

27.

考察: Kawashimaらの手法[5]と比較して有効だったもの • 実験A: • バス停に留まっている歩行者 • 間欠的な動きとなっていた並走車 MACアドレスの出現時間が長い 1分 BLEアドバタイジング・パケット車外車外バス停に留まっている歩行者 26 60秒未満 60秒以上出現時間バス停停車期間±10秒内出現期間 iOS 並走車バス停停車期間±10秒外 Android OS • 実験B: • バスを追い越したのち, 信号で再度合流する自動車 (間欠的な動き) 車内約2分車外で分類できないが動きが特徴的間欠的な動きをする自動車ゆえに提案手法なら分類可能 • 単純な出現時間では車外分類できないものでも提案手法なら一部可能 Yes パケット受信間隔中央値≦15秒 AND 最大間隔≧15秒 No 車内 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022.

28.

応用検証: バスODデータ推定 27 • 先行研究のアドレス紐付けアルゴリズム[5]を用いて, アルゴリズムの分類部分のみ変更し比較 • RSSIの手法は閾値の調整を実施済みのものを使用 • データセットとして路線バスデータ (便3つ分) 使用 • 分類性能同様, 再現率, 適合率, F1スコアで評価 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022.

29.

評価結果: バスODデータ推定 • 各便で見た時, 出現時間の閾値を一つのみにしたものと比べF1スコアにおいて全ての便で性能向上を確認 • RSSIの手法と比べ8:25の便, 14:30の便どちらも大差なく, 17:37の便では性能を大きく上回った • 全体で見た時最も高い適合率とF1スコアを達成性能汎用性 28 ODデータ推定結果便再現率 Oransirikulら[6] (RSSIの閾値調整あり) Kawashimaら[5] 提案手法適合率 F1スコア 8:25 0.545 0.600 0.571 14:30 0.105 0.667 0.182 17:37 0.229 0.533 0.320 全体 0.289 0.579 0.386 8:25 0.500 0.611 0.550 14:30 0.105 0.333 0.160 17:37 0.314 0.611 0.415 全体 0.316 0.571 0.408 8:25 0.409 0.900 0.563 14:30 0.105 0.400 0.167 17:37 0.343 0.632 0.444 全体 0.303 0.676 0.417 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022. 6. T. Oransirikul, I. Piumarta, and H. Takada, "Classifying passenger and non-passenger signals in public transportation by analysing mobile device Wi-Fi activity," Journal of Information Processing, vol. 27, pp. 25-32, 2019.

30.

おわりに • まとめ • バスODデータ推定におけるスマートフォンのバス車内外分類に注目 • 正確にバス車内外分類ができなければ紐付けの候補にバス車外のデータが増加し性能低下に繋がる • バスの車内外分類時にスマートフォン所持者の行動を考慮し, パケットの仕様とバスの情報から時間情報に関するアルゴリズムで分類 • 今後の展望 • 乗客の車内分類に焦点を当てた分類アルゴリズムの追加 • 乗客に見られる時間情報/RSSIの傾向を分類アルゴリズムに反映 • 時間情報以外のBLEアドバタイジングパケットの情報の活用 29

修士論文発表資料

yoshihara.arata.xx7

関連スライド

学振特別研究員になるために～2025年度申請版

研究に使える便利なフリーソフト ImageJ

大規模言語モデルに追加学習で専門知識を教える試み (2023, arXiv:2312.03360)

StampFlyで学ぶマルチコプタ制御

東京大学 3Dスキャン勉強会「フォトグラメトリ」

ZAZA株式会社_会社紹介

各ページのテキスト