1.8K Views
October 27, 22
スライド概要
2022年度地震学会秋季大会での発表資料です。
「Linked Dataを用いた地震データ整理と語彙の構築」
いんたーねっと
Linked Dataを用いた 地震データ整理と語彙の構築 総合研究大学院大学 上松 大輝 (Hiroki UEMATSU) [email protected]
目次 • 背景 – 地震データの取り扱い • 課題 • • • • Linked Data 地震オントロジーの構築 地震オントロジーを用いたLinked Data まとめ 2
背景 • 機械学習を用いた地震研究の拡大 – P波/S波のピックや、地震の検出など • ポスター:S21P-03, S21P-05, S21P-09 – 大量なデータから教師データを作成 • 必要なデータの発見と分類 – 気象庁や防災科学研究所が公開しているデータ – 自治体設置の観測網 – 研究者 / 個人の地震計、観測網 • 横浜市立大学 Citizen Seismology Network(CSN)など 3
日本の主な観測網 • 気象庁 – 地震カタログ • 震源データ、震度データなど年ごとの固定長データ – 波形データは主なデータのみ • 強振観測データ • 顕著な地震の観測・解析データ • 防災科学研究所 – – – – K-NET KiK-net Hi-net F-net 4
課題 • 観測網をまたいでの検索ができない – IDがないため、時刻や観測点をキーに検索ワードを作成 • 日付時刻の精度や観測点の違い • データ公開サイトのUI – 必要なデータを決めて、都度ダウンロード • 検索クエリなどをもとに一括ダウンロード等はできない • プログラム等による自動収集も難しい – 決められた項目での検索のみ • ユーザによる柔軟な検索は難しい • 公開されているデータのフォーマット – ファイル内にメタデータが含まれている • ファイルを開かないとメタデータにアクセスできない • 必要なデータなのかファイルを確認するまでわからない 5
Linked Dataを用いたメタデータの検索
Linked Dataとは • Web上のデータを相互に接続する仕組み – 機械可読の意味を持ったリンクを用いて接続 – さまざまなデータにURIを設定し、URI同士をリンク • <主語> <述語> <目的語>の3つ組で記述 • オープンなLinked Data = Linked Open Data (LOD) • 主に知識グラフとして活用 – Ex) wikipediaのデータを知識グラフ化したDBpedia 7
Linked Dataの構造 • RDFを用いて記述 • <主語><述語><目的語>の3つ組 <http://ja.dbpedia.org/resource/横浜市> dbo:location <http://ja.dbpedia.org/resource/神奈川県> http://ja.dbpedia.org /resource/横浜市 dbo:location http://ja.dbpedia.org /resource/神奈川県 事物や事柄を関係性で接続 8
地震のLinked Data 語彙の作成 9
キーワード整理 • 地震(名前付きの地震) – – – • 震源 ○○地震は気象庁が命名 1つの震源ではなく、複数の震源をまとめる場合がある 何かしらカテゴリがある • • • – 観測点で観測された地震波をもとに推定された震源 – 位置、深さ、マグニチュード、観測した観測点、地震波形、観測波形 – – 観測点で観測された地震(波形のURL) ミリ秒の時刻を示すなにか • • • • 地震動 地震波形 • • • 観測点と時刻がわかれば、ダウンロ ードで きるは ず Hi-net.py 観測点で観測された、地震としてマークされた波形 S波とP波の時刻を持つ 時刻、観測点、観測波形(生データ)へのリンク、タイムウィンドウ – 観測点で観測されたすべての波形 – 時刻、観測点、観測波形(生データ)へのリンク、タイムウィンドウ – 波形を観測するところ – 位置情報、名称、サンプリング周波数、観測点の管理者情報 – – – – 日本独自の指標 リアルタイム震度と観測後に計算された震度 気象庁の計測震度と海外の震度 震度階級はまた別 – 発泡時刻、震源、予測震度、該当地域 観測波形 観測点 • • 本当の震源は観測が難しい – – – • • 沈み込み断層での地震、群発地震、 繰り返 し地震 低周波地震、発破地震、 遠地、連発、深発 震度 震源を推定できない場合もある? 観測ネットワークによって目的が違 う 緊急地震速報 10
地震のための語彙 • 震源、観測波形、観測点を基点として作成 – 震源: • 地震動の発生源 • 震央の位置、マグニチュード等 – 観測波形: • 観測点で観測された波形 • 震源、観測点とリンク – 観測点: • 公開されている各観測網の観測点 • 観測点の位置、ステータス等 11
震源クラスのデータ
<https://seismic.balog.jp/resource/A2019052515400801> a jpe:hypocenter ;
rdfs:label "広島県南西部"@ja ;
skos:altLabel "広島県南西部"@ja ;
jpe:hypocenterKinds "震源レコード" ;
jpe:determinatedWay "気象庁震源" ;
jpe:originTime "2019-05-25 15:40:08+09:00" ;
schema:latitude 34.4327 ;
schema:longitude 132.4122 ;
jpe:magnitude 3.2 ;
jpe:shindo "震度2" ;
jpe:withTravelTimeTable "標準走時表(JMA2001)" ;
jpe:observedStationNum 19 ;
jpe:depth 19.04 .
12
震源クラスのデータの構造例 determinatedBy 3.2 気象庁 magnitude shindo 2 <https://seismic.balo g.jp/resource/A20190 52515400801> rdfs:label 広島県 西部 lat 34.4327 lon depth originTime 2019-05-25 15:40:08+09:00 132.4122 19.04 13
観測波形クラス
<https://seismic.balog.jp/resource/5920330-A2019052515400801> a jpe:observedWave ;
schema:startTime "2019-05-25 15:40:11+09:00" ;
jpe:Shindo 2 ;
jpe:calcShindo 1.5 ;
jpe:hasHypocenter <https://seismic.balog.jp/resource/A2019052515400801> ;
jpe:observedBy <https://seismic.balog.jp/resource/sta-5920330> .
14
観測波形クラスのデータの構造例 hasHypocenter 2 <https://seismic.balo g.jp/resource/A20190 52515400801> calcShindo shindo 2 <https://seismic.balo g.jp/resource/592033 0A2019052515400801 > observedBy <https://seismic.balo g.jp/resource/sta5920330> startTime 2019-05-25 15:40:11+09:00 15
観測点クラス
<https://seismic.balog.jp/resource/sta-5920330> a jpe:observer ;
jpe:stationIdentifier "5920330" ;
rdfs:labal "広島西区己斐*"@ja ;
skos:prefLabal "広島西区己斐*"@ja ;
jpe:observationNetwork "気象庁"@ja ;
schema:latitude 34.24 ;
schema:longitude 132.25 ;
schema:availabilityStarts "199810151200" .
16
観測点クラスのデータの構造例 stationIdentifier 199810151200 5920330 availabilityStarts <https://seismic.balo g.jp/resource/sta5920330> lat 34.24 lon rdfs:label 広島西区 己斐* observationNetwork 気象庁 132.25 17
地震に関する情報の検索 18
地震オントロジーを用いた検索 • SPARQLを用いた地震の検索 – Linked Dataを検索するための言語 • 地震オントロジーを用いたSPARQLエンドポイント – https://seismic.balog.jp/sparql • 気象庁、防災科学研究所の一部のデータ • 例: – 2018年以降に発生した最大震度5強を観測した地震のうち、 計測震度4以上の観測波形と震源の情報 19
検索の例文
select distinct * where {
?s a <https://seismic.balog.jp/ontology/jp-earthquake.ttl#hypocenter> .
?s jpe:originTime ?origin .
?s jpe:shindo ?shindo.
FILTER(xsd:dateTime(?origin) > "2018-01-01T00:00:00"^^xsd:dateTime)
FILTER CONTAINS(xsd:string(?shindo), '震度5強’)
?obs_wave jpe:hasHypocenter ?s ;
jpe:observedBy ?sta ;
jpe:calcShindo ?calcShindo.
FILTER (?calcShindo >= 4 )
?sta rdfs:labal ?name .
}
ORDER BY ?sta
LIMIT 100
20
LOD化のメリット • さまざまなデータが相互につながる – 観測網をまたいで検索可能 • 気象庁と防災科学研究所のデータをまたいで検索可能 – ex) 気象庁の特定の震源を観測した観測点付近のK-NETの観測点 – 地震を観測した地域の他の情報 • 被害情報や、過去の被害、人口、歴史など • WikipediaやWikidataなどのデータともつながる • 利用者が柔軟にデータを検索可能 – 検索に使う情報をシステムのUIに制限されない • ex) 同じ震源で同じ震度を観測した観測点のリスト • フォーマットの共通化 – 研究で利用したデータセットの公開 • データ本体ではなく、データにアクセスするための情報 21
まとめ • LOD化のために地震語彙を作成 – 地震オントロジー • https://seismic.balog.jp/ontology/ • 公開されている地震に関する情報をLODに変換 – 観測された波形や、震源の情報を柔軟に取得可能 • https://seismic.balog.jp/sparql • Ex) 特定の震度以上を観測した震源を持つ観測点と観測データ – 地震波形本体は公開形式によってアクセス不可 • 今後の展望 – 検索結果から波形などのRawデータを取得 • Rawデータへアクセスするためのパラメータ整理 22