445 Views
March 12, 25
スライド概要
バスODデータ自動取得に向けた BLEアドバタイジング・パケットのスマートフォン 所持者の行動を考慮したバス車内外分類 吉原 新太 情報基盤システム学研究室
1 研究背景: 効率的な運行サービスのためのバスODデータ • バス事業の現状[1] • 地方部を中心にバスドライバー不足 が深刻化 • 運転業務に対する低い賃金水準 バスサービス提供者は 少ない人員で効率の良い運行サービス への改善が課題 • 利用者の減少 • コロナウイルスの影響 • 地方部の過疎化 等々 • ODデータを活用した運行計画改善[2] 停留所 01_A 02_B 01_A 03_C 2 04_D 3 1 6 8 9 0 3 2 • OD(Origin Destination)データ: 02_B 2 乗降者が乗車・降車したバス停を表す表データ • 人力による取得→人件コストが高い 03_C 9 3 04_D 5 3 1 05_E 4 7 7 • 少ないコストで自動取得することを検討 1. 国土交通省, “地域の公共交通を取り巻く現状と検討の視点・課題”,https://www.mlit.go.jp/sogoseisaku/transport/content/001728295.pdf,Sep. 2023 2. 中部運輸局, “バスデータ活用大百科”, https://wwwtb.mlit.go.jp/kanto/content/000166077.pdf, Mar. 2020 05_E ODデータのイメージ 9 3
研究背景: ODデータの自動取得方法 2 • ICカードによる取得 各手法の比較 • ICカードの情報を使えない場合が多い • ICカード業者から購入する必要性 ICカード カメラ (備え付け) MACアドレス コスト × × ◯ 時間帯 ◯ △ ◯ 人数の影響 ◯ × △ 車外の影響 ◯ ◯ × • タッチ決済の場合乗車または降車情報のみ • カメラによる取得 • 備え付けの低解像度監視カメラを使用 • MLモデルを使用すると高コスト • 人同士が重なると性能低下 • MACアドレスの追跡による手法 • 汎用的かつ低コストで使用可能 • MACアドレスのランダム化により追跡が難しい 本研究ではコスト面・汎用面から MACアドレスの追跡による手法に着目
想定するパケットの検討 • 先行研究で使用されていたパケット • Wi-Fiのプローブリクエスト • 送信間隔が数秒〜数分と長く, MACアドレスランダム化が頻繁に発生 • BLEアドバタイジング・パケット: COCOA(新型コロナウイルス接触確認アプリ[3]) • 現在運用停止につき使用不可 • 今回使用するパケット: 以下のBLEアドバタイジング・パケット • Find My[4](iOSの「デバイスを探す」機能) • 送信間隔: およそ2秒 • MACアドレスランダム化の頻度: 数分〜数十分 • Google LLCのパケット(Googleアカウントでログイン済みのAndroidデバイスで確認) • 送信間隔: およそ0.3秒 • MACアドレスランダム化の頻度: 数分〜十数分 3. 厚生労働省, “新型コロナウイルス接触確認アプリ (COCOA) COVID-19 Contact-Confirming Application”, https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/cocoa_00138.html 4. A. Heinrich, M. Stute, T. Kornhuber, and M. Hollick, "Who Can Find My Devices? Security and Privacy of Apple's Crowd-Sourced Bluetooth Location Tracking System," in Proceedings on Privacy Enhancing Technologies, vol. 2021, no. 3, pp. 227-245, 2021. 3
本研究で想定するバスのODデータ推定方法 4 • ODデータ推定のプロセスは大きく以下の三つ ランダム化された MACアドレスを紐付け BLEアドバタイジング・ パケットを収集 • イメージ 紐付け 00:00:5e:00:53:00 乗車 時刻表と突合し ODデータ推定 紐付け 00:00:5e:00:53:05 同じデバイスの MACアドレス ・出現したタイミング: 乗車 ・消失したタイミング: 降車 としてODデータを推定 00:00:5e:00:53:03 降車
ODデータ推定における課題 • バス車外のデバイスのBLEアドバタイジング・パケットがノイズ • 歩行者のデバイスのBLEアドバタイジング・パケット • 自動車のデバイスのBLEアドバタイジング・パケット etc. • ノイズが増えることにより, 同一デバイスのMACアドレス紐付けが 困難になる • ノイズを可能な限り減らし, 乗客のMACアドレスのみで紐付けることが理想 MACアドレスをバス車内外に分類し, ノイズを可能な限り減らしたい 5
バス車内外分類の研究: 時間情報を使用した手法[5] 6 • MACアドレスの出現時間が閾値以上か未満でバス車内外に分類 歩行者や自動車といった短時間しか現れないMACアドレスの除去に有効 一部バス車外の自動車, 歩行者の行動を考慮し切れていない • 信号で停止する自動車 • バス停でバスを待っている人etc. MAC addr4 車外 MAC addr3 車内 MAC addr2 車外 MAC addr1 車外 0秒 50秒 出現時間 (秒) 分類方法のイメージ図 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022.
バス車内外分類の研究: RSSIを使用した手法[6] 7 • バス車内外のパケットを取得し, 平均RSSI, 出現時間の閾値でバス車内外に分類 F1スコア75%でリアルタイムにバス車内人数を推定 • スニファーの位置 • スニファー: • パケットを採取するソフトウェア/ハードウェア • バス車内の配置 etc. RSSI (dBm) RSSIに関して車内環境に合わせた閾値設定が必要 90秒 MAC addr2 車内 MAC addr3 MAC addr1 -40dBm 車内 -60dBm 車外 出現時間 (秒) 分類方法のイメージ図 6. T. Oransirikul, I. Piumarta, and H. Takada, "Classifying passenger and non-passenger signals in public transportation by analysing mobile device Wi-Fi activity," Journal of Information Processing, vol. 27, pp. 25-32, 2019.
研究目的と課題 • 目的: 汎用的かつ高性能なバス車内外分類手法の開発 • 課題: スマートフォン所有者の行動を考慮した汎用的な方法の考案 • バスやスニファーの設置位置といったRSSIに関して車内環境に依存した値を使用しない • 車内環境に応じたRSSIの閾値設定不要 • バス車内外の状況を考慮 • スマートフォンを持つ歩行者/自動車の挙動 8
既存路線で取得したバス車内外のデータ分析 9 • 中鉄バス国立病院線[7]で収集されたデータ (路線バスデータ) をもとに, バス車内 外にRSSI/送信時間にどのような傾向を持つデータがあるか調査 • 岡山大の研究チームが収集したデータを利用させていただいた • バスODデータ推定を目的として収集されたデータ • 中鉄バス国立病院線: • 走行距離: 10km程度 • バス停数: およそ30 • 3つの便 (片道) のデータを使用 • 8時25分天満屋発 • 14時30分天満屋発 • 17時37分天満屋発 7. 中鉄バス株式会社, “路線バス 国立病院線”, http://www.chutetsu-bus.co.jp/rosen/kokuritu.html
MACアドレスが変わっていないパターン (iOS) 10 赤点線: バス停に着いた時刻 青点線: バス停を出発した時刻 • 全ての便でMACアドレスが 同じものを確認 • 乗客のRSSI/送信間隔のパターンと定義 • 以降で乗客と比較して特徴的な傾向 を示すMACアドレスの例を図示 • RSSIのばらつきが大きいため, 前後5秒間の移動平均を計算し図示 8時25分の便で見られた共通のMACアドレスのデータ
確認できた特徴的なパターン • 非常に短い期間で出現 • バス停停車期間内のみ出現 • パターンに対する仮説: • パターンに対する仮説: 例: 車道で追い越してきた自動車 例: バス停で他のバスを待つ歩行者 11 • 間欠的な動き • 一度MACアドレスが出現したのち, 時間を空けて再出現 • パターンに対する仮説: 例: 一度バスを追い越し, 信号等に よりバスに追いつかれた自動車 出現時間が短いパターンの例 バス停停車期間内のみ受信できたパターンの例 間欠的な動きをしているパターンの例
提案手法 12 • 仮説をもとにバス車内外分類アルゴリズムを作成 • 閾値を以下で設定 • 時間情報(バスの停車時間情報/速度情報含む) • BLEアドバタイジング・パケットの仕様 • 以下のいずれかに当てはまるものを 車外に分類 1. 出現時間が短いパターン 2. バス停停車期間内のみ受信できたパターン 3. 間欠的な動きをしているパターン BLEアドバタイジング・パケット 車外 車外 60秒未満 60秒以上 出現時間 バス停停車期間±10秒内 出現期間 iOS バス停停車期間±10秒外 Android OS 車内 車外 Yes パケット受信間隔 中央値≦15秒 AND 最大間隔≧15秒 No 車内
評価用データセットの作成 • 路線バスデータはバス車内/車外のラベル無し • バス車内外の任意のデータを作成し, ラベル付された評価用 データセットを作成 • 実験A (奈良先端大のS3教室とその周辺環境で実施した実験) • 実験B (実際に使用されているバスを使用して実施した実験) 13
データセットの作成方法 • データセットはスマートフォンを所持した人が動くことで作成 • バスは動かすことができない→被験者側がバスと歩行者/自動車との相対的な動きをする • 相対的な速さは「歩く/走る」で再現 • 例: バス停車時にバス停で待っている人を再現したい時 本来の挙動 実験での再現方法 14
実験A: 奈良先端大学内で実施した実験 • 奈良先端大のS3教室 (共用ゼミ室3) をバス, その周辺環境を歩道・車道と見立て実験 • 15 進行方向(仮定) 教室の右側がガラス窓, 他3面がコンクリート壁 • バス車内の環境に類似 教室内 料 金 箱 • 事前に設定したスケジュール通りに スマートフォン(iOS/Android)を所持した被験者が行動 • 実験で設定した観測対象 • • バス停に留まっている歩行者 バスが停まっている時に歩道を通る歩行者 • バスが停まっている時にバスの前を横切る 歩行者 バスを追い越す自動車 • • • • 歩 バスを追い越したのち, 信号で再度合流する 自動車 使用したスマートフォン(実験A/B共通) 並走車 乗客 機種名 OSバージョン • • • • 料金箱へ移動 席を移動 乗車 降車 Android iOS Pixel 4a 13 iPhone SE2 18.1.1 iPhone 15 Pro スニファー 車 60cm 60cm S3 教室 道 スニファー 60cm 道 スニファー 後 17.6.0 17.4.1 前 実験Aの環境
実験B: 実際のバスを使用した実験 16 進行方向(仮定) • 奈良交通株式会社の北大和営業所の一部と バス一台を借りることで実験環境を用意 バス車内 • バス 前 出口 • 実際の運行で使用されている全長11mのもの • 実験A同様, 事前に設定したスケジュール通りに スマートフォン(iOS/Android)を所持した被験者が行動 スニファー 歩 車 • 実験で設定した観測対象 • バスを追い越したのち, 信号で再度合流する 自動車 • 並走車 • 乗客 • 料金箱へ両替のために移動 • 席を移動 • 乗車 • 降車 入口 バ ス 道 スニファー 道 スニファー 後 実験Bの環境
データセットの評価 17 • 定性的な観点から, 実験A/Bで収集したデータセットが仮説通りのパ ターンになっているか評価 • 評価方法: • 路線バスデータと比較し, パターン通りの動きと言えるか確認 • 以降で実験A/B, 路線バスデータの比較結果について述べる
取得したデータの分析: 間欠的な動きをしているパターン(iOS) • 設定した観測対象の中で以下が該当 18 ※実験Bではバス車外のiPhoneがFind Myパケットを送信して いなかったため, 同様に追跡可能な別のパケットを使用する • バスを追い越したのち, 信号等で再度合流する自動車 (実験A/B) • 実データと比較 • バス路線で収集したデータと同じような挙動であることを確認 • 再出現までに一定期間空いている 実験A: 間欠的な動きをする自動車のパターン 実験B: 間欠的な動きをする自動車のパターン 路線バスデータのパターン3 • これ以外の車外パターンも路線バスデータと同じような挙動であることを確認
取得したデータの分析: 乗車中の乗客 (iOS) 19 • 設定した観測対象の中で以下が該当 • 乗客 (実験A/B) • 実データと比較 • バス路線で収集したデータと同じような挙動であることを確認 • 一部RSSIの上下はあるものの受信が止まるような部分は見られなかった 座席の移動 料金箱へ移動 料金箱へ移動 座席の移動 実験A: 乗客のパターン 実験B: 乗客のパターン バス路線データの乗客と思われるパターン
取得したデータの分析: 乗車中の乗客 (Android) 20 • RSSIが小さく, 車外のデータは基本的に受信していなかった • 実験Aでは乗客のみ, 実験Bでは乗客と並走車が受信できていた • 乗客はRSSIが小さいことから途中で受信が途切れる場面も見られた • Androidは「間欠的なパターン」を車外として分類すべきでない 座席の移動 料金箱へ移動 座席の移動 料金箱へ移動 実験A: 乗客のパターン 実験B: 乗客のパターン
車内外分類性能の評価 21 • MACアドレスによるバス車内外分類の性能評価 • 適合率・再現率・F1スコアで評価 • バス非利用者の車外分類精度を検証 • 評価に使用する実験データ (最前席に設置したスニファーのデータ) • 実験A:ラベル付きデータの1パターン • 実験B:ラベル付きデータと全車外デバイス (対象外デバイス) を含めた2パターン • 既存手法との性能比較 • Kawashimaらの手法[5] • Oransirikulらの手法[6] • 車内のMACアドレスを確実に車内に分類できることを重視 • 適合率は100%が前提 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022. 6. T. Oransirikul, I. Piumarta, and H. Takada, "Classifying passenger and non-passenger signals in public transportation by analysing mobile device Wi-Fi activity," Journal of Information Processing, vol. 27, pp. 25-32, 2019.
評価結果: 実験Aのデータセットに対するバス車内外分類 • Androidは車外MACアドレスがないため 評価しない • 22 MACアドレスの内訳 iOS 提案手法による車内分類は全て成功 • 提案手法が最も高い分類性能を達成 (適合率/F1スコア) Android 車内 7 11 車外 6 0 • 車内分類は全て成功 • 提案手法でバス車外に分類 できたパターン • • • 歩行者 (3パターン全て) バスを追い越した自動車 並走車 (一部) • 提案手法でバス車外に分類 できなかったパターン • • 実験Aのデータセットに対する分類結果 手法 再現率 適合率 F1スコア Oransirikulら[6](RSSIの閾値調整無し) 1.000 0.636 0.778 Kawashimaら[5] 0.429 1.000 0.600 提案手法 0.714 1.000 0.833 並走車 (一部) 間欠的な動きをする自動車 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022. 6. T. Oransirikul, I. Piumarta, and H. Takada, "Classifying passenger and non-passenger signals in public transportation by analysing mobile device Wi-Fi activity," Journal of Information Processing, vol. 27, pp. 25-32, 2019.
23 評価結果: 実験Bのデータセットに対するバス車内外分類 MACアドレスの内訳 iOS Android • iOSにおいて乗客の分類に全て成功 した上で高いF1スコアを達成 車内 7 11 • RSSIの閾値調整済み手法と同程度 車外 6 2 • 対して, Androidの分類は失敗 • Androidは並走車の動きをしており, 提案手法で車外に分類することは困難 実験Bのデータセットに対する分類結果 再現率 適合率 F1スコア 1.000 0.857 0.923 0.500 1.000 0.667 0.333 1.000 0.500 提案手法 0.500 1.000 0.667 Oransirikulら[6] (RSSIの閾値調整無し) 1.000 0.154 0.267 0.000 - - 0.000 - - 0.000 - - 手法 Oransirikulら[6] (RSSIの閾値調整無し) Oransirikulら[6] (RSSIの閾値調整あり) • 提案手法でバス車外に分類 できたパターン (iOS) • 間欠的な動きをする自動車 • 提案手法でバス車外に分類 できなかったパターン • 並走車 OS Kawashimaら[5] Oransirikulら[6] (RSSIの閾値調整あり) Kawashimaら[5] 提案手法 iOS Android 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022. 6. T. Oransirikul, I. Piumarta, and H. Takada, "Classifying passenger and non-passenger signals in public transportation by analysing mobile device Wi-Fi activity," Journal of Information Processing, vol. 27, pp. 25-32, 2019.
評価結果: 実験Bのデータセット+対象外デバイスを含めたバス車内外分類 24 MACアドレスの内訳 iOS • 出現時間の閾値を使用する場合と比較 して分類性能向上を確認 • RSSIを使った手法に比べ性能が低下 • バスが動いておらず, 営業所にいた従業員の方 や周りに滞在していた人の車外分類に失敗 したと考えられる Android 車内 7 11 車外 279 285 実験Bのデータセット+対象外デバイスを含めたデータに対する分類結果 再現率 適合率 F1スコア 1.000 0.996 0.998 0.989 1.000 0.995 0.814 1.000 0.897 提案手法 0.839 1.000 0.912 Oransirikulら[6] (RSSIの閾値調整無し) 1.000 0.963 0.981 0.891 1.000 0.942 0.881 1.000 0.937 0.884 1.000 0.939 手法 OS Oransirikulら[6] (RSSIの閾値調整無し) Oransirikulら[6] (RSSIの閾値調整あり) Kawashimaら[5] Oransirikulら[6] (RSSIの閾値調整あり) Kawashimaら[5] 提案手法 iOS Android 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022. 6. T. Oransirikul, I. Piumarta, and H. Takada, "Classifying passenger and non-passenger signals in public transportation by analysing mobile device Wi-Fi activity," Journal of Information Processing, vol. 27, pp. 25-32, 2019.
25 考察: 車外のパターンが意図していない分類だったもの 車外に分類できていなかった ・送信間隔の最大値: 138.4秒 ・送信間隔の中央値: 26.1秒 2つ中1つのMACアドレスが で車外に分類 ・送信間隔の最大値: 16.0秒 ・送信間隔の中央値: 2.0秒 BLEアドバタイジング・パケット 車外 間欠的な動きをする自動車 並走車 車外 60秒未満 60秒以上 出現時間 バス停停車期間±10秒内 出現期間 バスとの距離が7mと実際の距離より離れており, パケットが受信しにくい状況だった可能性 → のみ車外に分類できるはずが でも分類できていた ・送信間隔の最大値: 18.0秒 ・送信間隔の中央値: 4.0秒 歩道側ではなく車道側で動きを再現したため, バス停に留まっている歩行者 上記と同様の問題が発生していた可能性 iOS バス停停車期間±10秒外 Android OS 車内 車外 Yes パケット受信間隔 中央値≦15秒 AND 最大間隔≧15秒 No 車内
考察: Kawashimaらの手法[5]と比較して有効だったもの • 実験A: • バス停に留まっている歩行者 • 間欠的な動きとなっていた並走車 MACアドレスの 出現時間が長い 1分 BLEアドバタイジング・パケット 車外 車外 バス停に留まっている歩行者 26 60秒未満 60秒以上 出現時間 バス停停車期間±10秒内 出現期間 iOS 並走車 バス停停車期間±10秒外 Android OS • 実験B: • バスを追い越したのち, 信号で再度合流する 自動車 (間欠的な動き) 車内 約2分 車外 で分類できないが動きが特徴的 間欠的な動きをする自動車 ゆえに提案手法なら分類可能 • 単純な出現時間では車外分類できないものでも提案手法なら一部可能 Yes パケット受信間隔 中央値≦15秒 AND 最大間隔≧15秒 No 車内 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022.
応用検証: バスODデータ推定 27 • 先行研究のアドレス紐付けアルゴリズム[5]を用いて, アルゴリズムの 分類部分のみ変更し比較 • RSSIの手法は閾値の調整を実施済みのものを使用 • データセットとして路線バスデータ (便3つ分) 使用 • 分類性能同様, 再現率, 適合率, F1スコアで評価 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022.
評価結果: バスODデータ推定 • 各便で見た時, 出現時間の 閾値を一つのみにした ものと比べF1スコアに おいて全ての便で 性能向上を確認 • RSSIの手法と比べ8:25の便, 14:30の便どちらも大差な く, 17:37の便では性能を 大きく上回った • 全体で見た時最も 高い適合率とF1スコア を達成 性能 汎用性 28 ODデータ推定結果 便 再現率 Oransirikulら[6] (RSSIの閾値調整あり) Kawashimaら[5] 提案手法 適合率 F1スコア 8:25 0.545 0.600 0.571 14:30 0.105 0.667 0.182 17:37 0.229 0.533 0.320 全体 0.289 0.579 0.386 8:25 0.500 0.611 0.550 14:30 0.105 0.333 0.160 17:37 0.314 0.611 0.415 全体 0.316 0.571 0.408 8:25 0.409 0.900 0.563 14:30 0.105 0.400 0.167 17:37 0.343 0.632 0.444 全体 0.303 0.676 0.417 5. M. Kawashima, I. Arai, A. Endo, M. Kakiuchi, and K. Fujikawa, "Origin destination estimation carrying over rolling proximity identifiers with RSSI," in Proc. IEEE Global Conference on Artificial Intelligence and Internet of Things (GCAIoT), pp. 7-12, Dec. 2022. 6. T. Oransirikul, I. Piumarta, and H. Takada, "Classifying passenger and non-passenger signals in public transportation by analysing mobile device Wi-Fi activity," Journal of Information Processing, vol. 27, pp. 25-32, 2019.
おわりに • まとめ • バスODデータ推定におけるスマートフォンのバス車内外分類に注目 • 正確にバス車内外分類ができなければ紐付けの候補にバス車外のデータが増加し 性能低下に繋がる • バスの車内外分類時にスマートフォン所持者の行動を考慮し, パケットの仕様とバスの情報から時間情報に関するアルゴリズムで分類 • 今後の展望 • 乗客の車内分類に焦点を当てた分類アルゴリズムの追加 • 乗客に見られる時間情報/RSSIの傾向を分類アルゴリズムに反映 • 時間情報以外のBLEアドバタイジングパケットの情報の活用 29