「人流データの利活用」とデータ分析を考える by 伊藤昌毅(公開版)

3K Views

March 07, 24

スライド概要

2024年3月4日に開催された 建設コンサルタンツ協会 令和5年度 交通・安全専門委員会講習会「人流データ等の交通・安全分野への利活用について」における伊藤昌毅の講演資料です。

profile-image

伊藤昌毅 東京大学 大学院情報理工学系研究科 附属ソーシャルICT研究センター 准教授。ITによる交通の高度化を研究しています。標準的なバス情報フォーマット広め隊/日本バス情報協会

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

公開版 2024年3月4日 東京都千代田区 建設コンサルタンツ協会 令和5年度 交通・安全専門委員会講習会 「人流データ等の交通・安全分野への利活用について」 「人流データの利活用」とデータ分析を考える 東京大学 大学院情報理工学系研究科 附属ソーシャルICT研究センター 伊藤昌毅

2.

伊藤 昌毅 • • • • • • 東京大学 大学院情報理工学系研究科 附属ソーシャルICT研究センター 准教授 一般社団法人 日本バス情報協会 代表理事 静岡大学 土木情報学研究所 客員教授 専門分野 – – ユビキタスコンピューティング 交通情報学 – – – – – – – – 静岡県掛川市出身 2002 慶應義塾大学 環境情報学部卒 2009 博士(政策・メディア) 指導教員: 慶應義塾大学 徳田英幸教授 2008-2010 慶應義塾大学大学院 政策・メディア研究科 特別研究助教 2010-2013 鳥取大学 大学院工学研究科 助教 2013-2019 東京大学 生産技術研究所 助教 2019-2021 東京大学 生産技術研究所 特任講師 2021-現在 現職 – 運行管理者(旅客) 経歴 資格 3

3.

伊藤×国土交通省 • • • • • • • • • 標準フォーマット関連 – – – – バス情報の効率的な収集・共有に向けた検討会 座長(H28年度) 標準的なバス情報フォーマット利活用検討会 座長(H29年度) バス情報の静的・動的データ利活用検討会 座長(H30年度) GTFS-JPに関する検討会 委員(R2年度) – 公共交通分野におけるオープンデータ推進に関する検討会 委員(H29年度-R3年度) – – 都市と地方における新たなモビリティサービスのあり方懇談会 委員(H30年度) 新モビリティサービス推進事業有識者委員会 委員(R1年度) – 交通政策基本計画小委員会 委員(R1年度-R5年度) – シェアサイクルの在り方検討委員(R1年度-) – 鉄道の混雑緩和に資する情報提供のあり方に関する勉強会 委員(R2年度) – 運行管理高度化検討会・ワーキンググループ(R2年度-) – バス事業者の許可申請等におけるGTFS-JPの実務者協議会(R5年度-) – 「地域公共交通計画」の実質化に向けた検討会(R5年度) オープンデータ関連 MaaS関連 交通政策審議会 シェアサイクル 鉄道 点呼 申請オンライン化 地域公共交通計画

4.

伊藤×経済産業省・総務省 • 経済産業省 オープンデータ関連 – 官民データの相互運用性実現に向けた検討会 座長(H29年度) – 情報共有基盤 利用促進ワーキンググループ 委員(H30年度) • 総務省 オープンデータ関連 – 地域情報化アドバイザー(R2年度〜R3年度)

5.

伊藤×地方自治体 • • • • • • • 沖縄観光2次交通の利便性向上に向けた検討委員会 座長(H30年度〜) 群馬県バスロケーションシステム実証実験 アドバイザー(R1年度) さいたま市 スマート駅広研究会 副会長(R2年度〜R3年度) 佐賀市 街なか未来技術活用モデルプラン策定業務有識者会議 委員(R2年度) 東京都 東京都における地域公共交通の在り方検討会 委員(R2年度〜R3年度) 熊本市 熊本版MaaS勉強会 有識者委員(R3年度〜) 杉並区地域公共交通活性化協議会 会長(R3年度〜) • その他自治体主催のイベントでの講演多数 – 静岡県掛川市、石川県能美市、群馬県、島根県安来市、沖縄県、富山県、岐阜県、北海道など

6.

人流データ

7.

人流データ ≠ 人の流れのデータ • 人流データという言葉は「人の動きや流れを表現したデータ」 という意味では使われていない – アンケート調査、従来からの交通量調査などのデータは「人流データ」とは呼ば ない • 主にスマートフォンから、ID+時刻+位置データを取得し、ID や場所を軸に整理したデータ – IDで整理すれば人の動きを追えるデータになる(ただし人がスマホを常時携帯し ていることが前提) – 場所で整理すれば人口密度や混雑のデータになる

8.

デジタルっぽさ、ビッグデータっぽさが大事? • 新しいデータ取得手段であることが大事 – 「人流データ」という語は技術用語ではなくマーケティング用語ではないか • ビッグデータ: 偏った集団に対する網羅的データになりがち – 偏り: ○○アプリのユーザ、○○の会員、地域、性別、年代など – 目的とマッチしないと使い物にならない – 「補正・拡大推計」は学術の議論。実務レベルでは難しいのではないか

9.

役に立ちそうな感じは溢れてるけど・・・ • • • • マーケティング 交通計画・都市計画 防災・防犯 地域活性化・地方創生 • 今風のビッグデータなので凄いことが出来そう・・・

10.

特徴: データと利用のアンバンドル 目的 データ 分析手法 • 従来: 特定の目的のために、調査から結果まで一気通貫した 施策を実施 • 新しいデータ: – 目的や分析手法を定めないでデータが提供 – 従来の形で集められたデータも、徐々にアンバンドル去れ利用されるように

11.

うまくはまればとても有用 • 安価 – 自分で計測するよりは、はるかに安く網羅的にデータを得られる • 継続的に収集されており、後日でも入手出来る • IDを追った継続観測から得られる知見 – 場所のラベル付け「職場」「自宅」などが可能 – 短期・長期の行動の変化(4月を境に職場が変わった、普段より30分遅く家を出た等) • 期待できないこと(技術的制約・プライバシ保護) – 「流」を求めれば「量」はあきらめる • 流: どこから来たか、どこに行くか、どこに住んでいるかなど • 量:来場者数、AエリアとBエリアの人数比較など – 「量」を求めれば「流」は諦める

12.

はまった例 • 「研究」ならばうまくはまる事例に合わせて論文を書けばいい のだけれど・・・

13.

第68回土木計画学研究発表会(秋大会) 2023/11/26 ユーザ識別子付きスマホ位置情報活用による 大規模事業所の時差出勤施策が 渋滞解消に与える効果の分析 大塚 理恵子1・伊藤 昌毅2・太田 恒平3・瀬崎 薫4 1東京大学大学院 新領域創成科学研究科 博士課程後期 2東京大学大学院 情報理工学系研究科 3株式会社トラフィックブレイン 4東京大学 生産技術研究所 本研究成果は、国立研究開発法人情報通信研究機構の委託研究(01101)により得られたものです

14.

本セクションのスライドは 一般公開せず

15.

データ分析の「素振り」の回数を増やす しかないのでは? • 個人として向き合うだけでなく、業界としてどこまで挑戦でき るか 2023/11/26 31

16.

2024年3月2日 東京大学 本郷キャンパス 公共交通オープンデータ最前線 2024 交通情報学特論: 交通データ分析を学ぶ実践的な授業を始めました! 東京大学 大学院情報理工学系研究科 創造情報学専攻 准教授 伊藤昌毅

17.

最近聞くこと 地域交通の実務 • 公共交通データ分析 • データ活用 • EBPM AI応用研究 • 交通ビッグデータとAI • 交通の最適化 • 大規模な都市交通データ分 析

18.

交通データ触れたことありますか? • Excelで、GISで、SQLで、自作プログラムで、交通データを操れます か? – GTFS、GPSのプローブデータ、交通センサスデータなど • 発注者・行政職員が分かっていないことをいいことに、技術の研鑽を 怠っていませんか? • 「そういうのはできる人にやらせて、自分はもっと高度で戦略的な意志 決定を・・・」とか言ってませんか? • 交通を学ぶ学生を、交通ビッグデータにも触れないまま卒業させてしま うのはまずい

19.

2023年 東大大学院「交通情報学特論」開講 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 交通情報学入門 地理情報システム(GIS)と時空間データベース 1 地理情報システム(GIS)と時空間データベース 2 PostgreSQL + PostGIS + QGIS による公共交通データ分析 1 ゲスト講義1: Mobility as a Service (MaaS) の考え方と交通事業者から見た取り組みの意義 (藤垣洋平・小田急電鉄株式会社) PostgreSQL + PostGIS + QGIS による公共交通データ分析 2 PostgreSQL + PostGIS + QGIS による公共交通データ分析 3 Join応用、ウィンドウ関数 ネットワークの探索と自動車交通 交通流シミュレーション入門 ゲスト講義2: 交通×IT×データのこれまでとこれから (太田恒平・株式会社トラフィックブレイン) ミクロ交通流シミュレーションSUMO深掘り 都市交通計画学温故知新 交通情報学の未来(ディスカッション)

20.

講義の特徴 • 交通の考え方や理論よりIT・データの技術にフォーカス – 理論的な説明や深い考えを説明する講義は他にもあるので・・・ • 実際にデータやツールを配布し、手を動かしながら技術を身に 付ける – 学生ひとりひとりがQGIS、PostgreSQL、大都市交通センサスデータなどを自ら のPCにインストール – 講師は講義時間の半分くらいは実際にPCを操作し説明 • 教室とオンラインのハイブリッド形式、コメントを通した学生 とのフリーディスカッション

21.

• x

22.

どんなデータを利用している?

23.

GTFSオープンデータ • 世界で広く使われる形式 • 乗換案内に必要な情報(バス停・駅+路線+時刻表+運賃)をまとめて格納 したファイル形式 バス停/駅+路線 時刻 運賃 39

24.

大都市交通センサス • 国土交通省が5年毎に首都圏、中京圏、近畿圏の三大都市圏に おいて、鉄道・バス等の大量公共交通機関の利用実態を調査 • 最新データは令和3年度に実施 • 調査方法 – 第12回まで:駅において鉄道利用者に紙の調査票を配布し、郵送等にて回収した うえで拡大する手法にて調査を実施(サンプル調査(32万件) – 第13回: 鉄道ICカードの利用実績をもとに集計する手法(非接触かつ全数調査 (1915万件)等に変更 https://www.mlit.go.jp/sogoseisaku/transport/sosei_transport_tk_000007.html

25.

GBFS(シェアモビリティデータ) • シェアモビリティの国際標準 フォーマット – シェアサイクル、シェアキック ボードなどのポートデータが公開 されている • 日本では2022年よりドコモ バイクシェア、ハローサイク リングのデータが公開 https://www.odpt.org

26.

基礎データ: 地理院地図 • 国土地理院が提供する – × Web地図サービス – ○ タイル地図配信サービス

27.

国勢調査の人口データ • Qiitaに公表した記事の前半 部分までを参照 – ただし記事は2015年データに基 づく。現在は2020年データも公 開 https://qiita.com/niyalist/items/d70f471c259211aa1554

28.

国土数値情報 • 国土交通省が整備している基礎的なGISデータ集

29.

国土数値情報 行政区域データ • 市区町村の境界を入手可能 • https://nlftp.mlit.go.jp/k sj/gml/datalist/KsjTmplt -N03-v3_1.html

30.

国土数値情報 鉄道データ

31.

国土数値情報 駅別乗降客数データ • 鉄道事業者からの情報提供に基 づき、駅ごとの乗降客数を提供 • https://nlftp.mlit.go.jp/ksj/g ml/datalist/KsjTmplt-S12v3_0.html

32.

道路交通センサス • 一般交通量調査と道路交 通起終点調査を実施し、 現在の道路の使われ方、 道路整備の現状等を把握 し、道路計画の策定や道 路の維持・修繕等に活用 • データの解釈には有償の デジタル道路地図 (DRM)データが必要 https://www.mlit.go.jp/road/census/h27/index.html

33.

JARTIC(日本道路交通情報センター)オープン データ • • • • • • 「交通規制情報」 一般道路の「断面交通量情報」 一般道路の「交差点制御情報」 それぞれ、2ヶ月遅れの最新データをWeb掲載 位置情報の取得には別途有償データが必要 https://www.jartic.or.jp/service/opendata/

34.

パーソントリップ調査 • 都市における人の移動に着目し た調査 – 世帯や個人属性に関する情報と1日の 移動をセットで尋ね「どのような人が、 どのような目的で、どこから どこへ、 どのような時間帯に、どのような交通 手段で」移動しているかを把握 – 公共交通、自動車、自転車、徒歩と いった交通手段の乗り継ぎ状況を捉え る – 全国の都市圏でおよそ10年おきに実施 https://www.mlit.go.jp/toshi/tosiko/toshi_tosiko_tk_000031.html

35.

2〜7回: QGISとPostGIS でSQLによる公 共交通データ分析を身に付ける

36.

今週・来週の目標 • 交通ビッグデータ をSQLとGISで可 視化・分析 – 今週:データ整形・分 析 – 来週:複数データの統 合・GISとの統合 https://twitter.com/kasobus/status/1650806981043814401 https://twitter.com/ShinagawaJP/st atus/1649382482947739648

37.

分析SQL: 表から表に変換する穴埋め型言語 select 出力する列(コラム)に関する記述 どの列をどのような表現で表示するか *は全部出力 from 入力する表(テーブル)の指定 where 出力する行に関する記述 どのような条件で絞り込むか

38.

駅間で検索(三鷹→根津) • 何時台に何人いる? • 東大前駅、本郷三丁目前駅利用者とどれが多い? • 今日の自分と同じ経路・時間帯の利用者は何人いた? select * from census13.od_level2 where origin_station ='三鷹' and destination_station = '本郷三丁目'

39.

Join: 複数のテーブルをある条件で横に結合 Line 開業年 一日利用者数 駅数 総延長(km) 丸ノ内線 1954 約130万 28 27.4 千代田線 1969 約60万 20 18.8 1978 約30万 17 42.6 Line 山手線 1909 約400万 29 34.5 丸ノ内線 1954 約130万 28 27.4 東京メトロ 2004 常磐線 1895 約100万 69 209.4 千代田線 1969 約60万 20 18.8 東京メトロ 2004 東横線 1926 約70万 21 24.2 京葉線 1978 約30万 17 42.6 JR東日本 1987 井の頭線 1933 約30万 18 12.7 山手線 1909 約400万 29 34.5 JR東日本 1987 京王線 1913 約50万 29 37.9 常磐線 1895 約100万 69 209.4 JR東日本 1987 東横線 1926 約70万 21 24.2 東急電鉄 1922 井の頭線 1933 約30万 18 12.7 京王電鉄 1948 京王線 1913 約50万 29 37.9 京王電鉄 1948 Operator 設立年 従業員数 総売上 東京メトロ 2004 約9,000 約4,000億 JR東日本 1987 約70,000 約3兆 東急電鉄 1922 約5,000 約1,000億 京王電鉄 1948 約3,500 約500億 開業年 一日利用者 駅数 数 京葉線 路線Tableの右に事業者Tableを結合 総延長(km) Operator 設立年

40.

そもそもなぜテーブルを分割する? • 1つのデータは一箇所で管理することで不整合を防 ぐ • データベースの正規化 – 通常、リレーショナルデータベースはjoinを前提に複数のテー ブルに分割してデータを保存する – 複数のテーブルに分割することを「データベースの正規化」と 呼ぶ • 良くある分割 – マスターテーブル: 人・モノなどの一覧(大きく変化しない) – トランザクションテーブル: 何かの処理の度に追加 Line Operator 丸ノ内線 東京メトロ 千代田線 東京メトロ 京葉線 JR東日本 山手線 JR東日本 常磐線 JR東日本 東横線 東急電鉄 井の頭線 京王電鉄 京王線 京王電鉄

41.

Joinの条件: IDで指定するのが基本 Line 開業年 一日利用者数 駅数 総延長(km) Operator 丸ノ内線 1954 約130万 28 27.4 10 千代田線 1969 約60万 20 18.8 10 京葉線 1978 約30万 17 42.6 20 山手線 1909 約400万 29 34.5 20 常磐線 1895 約100万 69 209.4 20 東横線 1926 約70万 21 24.2 30 井の頭線 1933 約30万 18 12.7 40 京王線 1913 約50万 29 37.9 40 ID Operator 設立年 従業員数 総売上 10 東京メトロ 2004 約9,000 約4,000億 20 JR東日本 1987 約70,000 約3兆 30 東急電鉄 1922 約5,000 約1,000億 40 京王電鉄 1948 約3,500 約500億 • データ各行を区別するIDを付与 – 1行を区別できるIDをプライマリーキー (primary key)と呼ぶ – この例では、OperatorテーブルのIDが相当 – 実際には、Lineを区別するIDもあった方がい い • 外部キー(foreign key) – 他のテーブルを参照するためのキー • 考察: Operator Table に foreign key としてLine IDを持てないか? – 1行に複数のkeyを設定できない – 一対多の関係では、多の側に外部キーを設定 する

42.

Primary Key について • DBを構築する際は、1行を区別できるID(primary key)を持 たせることが一般的 – Primary key は1つのコラムに限らない。複数のコラムの複合で区別できる場合 も多い • 現実のデータ分析ではIDの存在しないデータも多い – 例: 国土数値情報の駅データ。同名の駅を区別する方法がない – 第4回では、駅名+都道府県名を組み合わせて primary keyとした(それで区別 が出来ていたかは未検証)

43.

PostGISによるBuffering処理 • ST_Transformで一度 EPSG:32654に変換し、ST_Bufferで 800mの円を作成、更にそれをST_TransformでWGS84に戻す Select *, ST_Transform(ST_Buffer(ST_Transform(center, 32654), 800), 4326) as buffer from analysis.station_master where city is not null ; SQL-7-1 • city is not null を指定することで、市町村境界データとのjoin が成功した駅のみを抽出

44.

人口を面積で按分 • 5次メッシュ(250mメッシュ)の人口を面積で按分 駅勢圏の形状 重複部分を持つ5次メッシュ 重複部分を切り出したメッシュ

45.

• x

46.

select name, prefecture, city, sum(partial_population) as population from( select name, prefecture, city, population * ST_Area(ST_Intersection(buffer, wkb_geometry)::geography) / ST_Area(wkb_geometry::geography) as partial_population from( select *, ST_Transform(ST_Buffer(ST_Transform(center, 32654), 800), 4326) as buffer from analysis.station_master where city is not null )as data1 inner join base.population as pop on ST_Intersects(data1.buffer, pop.wkb_geometry) SQL-7-1 SQL-7-2改-2 )as data2 group by name, prefecture, city ; SQL-7-3

49.

ChatGPTを使って自動ダウンロードプログラム 作成方法を検討 • とりあえず聞くと大枠を教えて くれる – URLを直せばとりあえず使える • 更に修正するとしたら… – ダウンロードしたJSON形式をCSVに変 換してから保存 • Pandasを利用 – ファイル名にタイムスタンプを入れて、 重複がなくなるように – ダウンロードの度にデータを追記

50.

ハローサイクリング・ドコモバイクシェアのポート位置

51.

貸出可能な自転車数の変化 18 16 14 • x 12 10 8 6 4 2 0 5/25/23 0:00 5/25/23 4:48 5/25/23 9:36 5/25/23 14:24 5/25/23 19:12 5/26/23 0:00 5/26/23 4:48 5/26/23 9:36 5/26/23 14:24 5/26/23 19:12 5/27/23 0:00

52.

8回: 道路データと最短経路探索

53.

1. 2. 3. 4. 始点に最短距離0を設定する まだ辿ってない点の中から最短距離が分かっていて最も距離が短い頂点に移動 その頂点から繋がっている頂点の最短距離を設定する。この時にその頂点の最短距離を更 新できるなら更新 2-3を全ての頂点の最短距離をわかるまで行う 14 4 10 B E 21 10 0 35 G 18 16 A 12 15 C 1 9 3 12 D F 15 16 https://qiita.com/knhr__/items/cb3ce311508337128714

54.

pgRouting

55.

距離を cost としたときの経路探索 • x

56.

道路種別で cost を調整したときの経路探索 • 主要道路を通 行するように なった • 距離ではな く、時間をコ ストとして計 算したとも見 なせる

57.

9〜11回: 交通シミュレータsumoを学ぶ

58.

ネットワークを作成してみよう

59.

信号交差点の作成 • Traffic Light mode • 交差点を指定した状態 で”Create” • 交差点内の進路と階梯図が 自動作成される

60.

交通流の可視化 • 位置(X座標)とtimestampを用いてグラフ作成可能

61.

ゲスト講師(2023年版) • x

62.

レポート課題

63.

中間レポート: 大都市交通センサスの分析 • 大都市交通センサスから興味深いと思える交通現象を見つけ出し、地図 やグラフを使って説明せよ。 • 分量: 1000字以上 +図表を2点以上 – English: more than 500 words • SQLを利用した場合は、どのようなSQLを利用したかレポートに含める こと(末尾に付録 appendix として載せてもいい) 。SQLの利用は加点 要素である。 • ※ ChatGPTなど生成AIをレポート作成に利用した場合は、何をどのよう に利用したかをレポートに含めること(末尾に付録 appendix として載 せてもいい)。どのような使い方をしても減点はしない。 • 課題に対する要望は本日のコメントとしてください

64.

最終レポート課題 • 分量: – 1500字以上+図表を3点以上 (English: more than 750 words) – Appendixとしてレポートに利用したSQLやPythonプログラムなどを添付してください • 課題:「交通情報学特論」の講義内容を踏まえてこれからの交通の発展 に寄与するテーマを設定し、論じてください。 • テーマの例(これ以外でも自由に考えてください。テーマ自体の独創性 は求めません) – – – – 交通データに基づいた政策提言 交通データとシミュレーションを用いた交通現象の解明 GISによる交通の地域間比較と課題の発見 交通データ分析に使えるツールの調査と利用可能性 – – – – SQLや交通ビッグデータの利用、GISの利用、交通シミュレーションの利用 複数のデータを結び付けた分析 授業で扱っていないデータやITツールの活用 プログラミング • 加点要素(ITとデータの観点から「手を動かす」ことを重視します)

65.

講義はハイブリッド形式で実施 • 講義室+オンライン • 講義内容を録画し YouTube掲載 – 欠席の場合は動画でキャッチ アップも可能 – →レポート提出前に操作方法 などを復習 • 撮影やビデオ編集はま あまあ大変です。。。

66.

受講する方法 • 東京大学大学院へ入学 – 情報理工学系研究科だけでなく、ほとんどの学科から履修・単位取得が可能なよ うです • 大学院科目等履修生に出願 – 修士の学位を有する者、修士の学位を有する者と同等以上の学力があると本研究 科が認めた者 – https://www.i.u-tokyo.ac.jp/edu/exam/guide.shtml • 単位互換制度に基づいた履修 – 都内国立大学の大学院などと単位互換制度があるようです

67.

講義の一部を一般公開 • 学生とのディスカッションな どを除いた、主に講師が話す 部分を一般公開 – 講義資料や演習データなども一般公開 https://itolab.t.u-tokyo.ac.jp/education/

68.

技術の民主化 (democratization)が進行中 • 技術の民主化 – ここでは大学、大企業、先進国などにいなくても、誰もがその技術を身に付け活 用できる状況 – 例: • 3Dプリンタによって安価に工業製品レベルのモノづくりが個人で可能に • 低廉なコンピュータによって発展途上国でも情報教育が可能に • 背景:インターネットによりノウハウ、情報交換が加速 – 個人が知識やノウハウをメディアに乗せ発信することに追い風 – 検索によって世界最先端の知識に容易にたどり着ける https://en.wikipedia.org/wiki/Democratization_of_technology

69.

オープンソースソフトウェア(OSS)で 交通の課題に取り組める時代 • GISなら – ArcGIS 対 QGIS • データベース(RDBMS)なら – Oracle Database 対 PostgreSQL • 交通シミュレーションなら – PTV Vissim 対 sumo

70.

QGISとは • オープンソースのデスクトップ GIS – 2002年に初版公開 – Windows, macOS, Linuxなどで動作 • C++言語で開発され、商用GISに 匹敵する機能を備えており、プラ グインをサポート

71.

データにおいてもオープンデータが進行中 • 国の基礎データは多くが公開されている – 国勢調査、道路交通センサス • 交通データのオープン化も進行中 – 公共交通オープンデータ(路線バスなど) https://gtfs-data.jp https://www.e-stat.go.jp

72.

オープンを前提としたエコシステムの中で スキルを身に付ける必要性 • 技術(ツール)もデータもオープン化され、世界の誰もが最先端の ものにアクセスできるように • オープンソースは誰でも開発に参加できるため、最先端の知見が集 まるように • オープンな技術を前提としたスキルは所属組織などに因らず持ち運 び可能 • 特定の立場でのみアクセスできるデータ、特殊なツールや一般的で ないデータ形式などはあるが、スキルの中心にはなりにくい

73.

オープンソースとは? • ソフトウェアのソースコードがインターネットで公開されており、 誰もがプログラムの中身を読んだり開発に参加できる仕組み – オンラインで開発者コミュニティが組織されていることも多い • ソフトウェアは誰でも無料で入手でき、商用目的の利用や販売など も可能。 – オープンソースの要件を満たしたライセンスに従うソフトウェアがオープンソース – 企業がオープンソース開発者を雇用したり開発者に寄付することで貢献も • 用語(だいたい一緒) – アプリ=アプリケーション=ソフト=ソフトウェア – プログラム=ソースコード=ソース=コード

74.

QGISの場合 • GitHubにソースコード公開 – 開発者同士のディスカッション、 プログラムの修正などがオンライ ンで行われている https://github.com/qgis/QGIS

75.

なぜ苦労して作った プログラムを無料で 公開する? • (私見)インター ネットという無限の 知識や情報が交換さ れるプラットフォー ムにおける個人とし ての最善手ではない か?

76.

• ぜひ動画をご覧下さい • ぜひ講義を受けて下さい • 是非大学院を受験してください!

77.

デモ: データに触れてみよう

78.

全国鉄道運行本数データ • 鉄道のある区間に何本の列車 (普通列車)が走っているかを データ化 – 作成: 西澤明氏 • オープンデータとして誰でも利 用可能 – 伊藤研究室としてコストを掛けて作成し ているので、業務利用の場合はデータ作 成の継続への貢献を期待します • https://gtfs-gis.jp/railway_honsu/

79.

まとめ

80.

データ分析はとても難しい 目的 データ 分析手法 • 目的、データ、分析手法それぞれに多数の選択肢がある – 種類の違う複数のスキルが必要になる • いろいろな事情で、既に決まっていることが多い – 「こういう結果を出す」「こういうデータを使う」などが事前に固定されがち • 以前はデータと目的が一体化して大規模な調査を実施していたが・・・ – 例: パーソントリップ調査など

81.

「データ分析」したがるけど・・・ • 本来、結果が分からないからデータを分析する→受発注関係の 中でデータ分析することの困難さ • データ分析をしても、次のアクションが演繹的に導けるわけで はない – 分析結果を解釈し、判断するのは人間の力 – 「データがこうなっているから、こういう結論なんです」という論にはならない

82.

仮説検証ループを何度回せるか • データを見る→何かを思い付く(仮説)→データを確認してみ る→仮説の精度を高める • 結論ありきではなく、データありきでもなく、データに向き 合って仮説検証ループを回すのが大事 • 意思決定者こそデータに触れるべき or データに触れる者こそ 意志決定するべき – 現象やデータへの解像度が高まると意志決定の精度が高まる – データに対する「手触り感」を持たない人が意志決定することは今後困難になる のでは?

83.

人対人ではなく、皆がデータに向き合うように • 客観的なものに向 き合うことで、理 性的な対話が出来 る • 解釈のアイディア が出やすい • 「データモデレー タ」やれますか?