2.5K Views
February 22, 25
スライド概要
Global Power Platform Bootcamp 2025 in Japan登壇時の資料です。
GLOBAL POWER PLATFORM BOOTCAMP 2025 Japan セマンティック モデルの重要性と 活用戦略 ~人間クエリ根絶へ~ k_maki #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
自己紹介 k_makiとかいう人 • 銀行で働いています。 • VBAとかPythonとかやってきました。 • フィルター コンテキストを理解してからPower BIが好 きになりました • Qiitaで記事を書いてます。 k_maki – Qiita • Power BI勉強会で一緒に勉強しましょう。 Power BI 勉強会 - connpass #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
目次 1. 序 1.1. 対象読者・目的 1.2. データ活用の課題 2. セマンティック モデルの重要性 2.1. 「セマンティック」の意味を考える 2.2. 人間クエリの限界 2.3. セマンティック レイヤーによる解決 2.4. Power BIのセマンティック モデル 3. セマンティック モデル活用戦略 3.1. 人材育成 3.2. ITインフラ整備とシステム間連携 3.3. エグゼクティブ スポンサーシップ #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
1. 序 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
1.1. 対象読者・目的 1. ある程度Power BIを知っている人向け セマンティック モデルについてより深く理解してもらい、自分の仕事が価値あるものと再認識し てもらう。自信をもってモデルやレポートを作成しよう! 2. Power BIをよく知らないエグゼクティブ、管理者向け こういう大事な仕事があることを理解してもらう。特に、次のように考えている人向け。 ① 現場のExcel疲弊を認識しているが、どうしたらよいかわからない ② BI開発を軽視(≒ 若手の工夫の範疇と認識) 特に、後者のタイプの場合、評価や人材配置のミスマッチが生じがち。セマンティック モデル を理解した上で、組織/チームとしてどのように取り組むべきか真剣に考えてもらう。 (2.の人はここに来ていないので、実際はみなさんから話をすることになるかと思いますが。。) #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
1.2. データ活用の課題 1. ビジネス データの爆発的増加 ずっと同じ事業なら話は別だが、そんな会社はほぼない。 たいていは何らかの拡大(新商品、チャネル)やIoTデータなどで、データ量が爆増。当然形式 はバラバラ。網羅的に情報を把握するには、データ処理の負担は増加する。 2. 生データの複雑性とビジネス ユーザーの理解ギャップ 様々なデータソース(データベース、ファイルなど)を整形し、データを関連付けるだけでも難 しい。ここで「人間クエリ」の出番。 データ分析は、データの紐づけ、ビジネス価値の洞察という、要件が定まりにくい業務。なので、 システム化の対象から外れ、人間によるExcel手作業(コピペの嵐)に頼りがち。そもそもデータ の理解で疲弊、さらにデータは増え続ける。どうすんのこれ? #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
1.2. データ活用の課題 (cont.) 3. セマンティック レイヤーによる解決 セマンティック レイヤーの役割は、データとビジネス価値をつなぐ「架け橋」。生データをビジ ネスユーザーが活用できるようにするために、間に入るもの。 4. セマンティック レイヤーの重要性と活用戦略 最終的なレポートが大事ではあるが、その前段階のセマンティック レイヤーの作成はもっと大事 だよと。その話をしたい。 そして、不幸しか生まない「人間クエリ」根絶につなげたい。 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
2. セマンティック モデル の重要性 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
2.1. 「セマンティック」の意味を考える 1. 「セマンティック」=「意味付けられた」ということ どのような「意味」か?セマンティックになることで、ただのデータと何が異なるのか? 答えはビジネス価値の有無。セマンティックとは、「正しいデータを、すぐに使える」状態とい うこと。ビジネス インテリジェンスの文脈で言えば、セマンティックとはビジネス インテリ ジェンスにつながるように意味付けられたということ。 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
2.1. 「セマンティック」の意味を考える(cont.) 2. 「セマンティック レイヤー」=データとインテリジェンスの橋渡し 売上データを例に考えてみる。 ① 生データ データソースがバラバラ。チャネルの基幹システム別(実店舗、オンライン(自社サイト)、 オンライン(他社ECサイト)等)に顧客ID、商品ID、購入数量、購入日時が記録されるため。 しかもIDなどのマスター データもシステム毎にバラバラ。単価は別テーブルに入っているので、 紐づけないと合計金額は分からない。 ② セマンティック レイヤー 生データを変換し、顧客ID、商品ID、チャネルID、購入単価、購入数量、購入日時を単独の テーブルで保持する(データソースの分断を吸収、IDは統一されたもの)。 セマンティック レイヤーでは分析が容易な状態になっている! #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
2.1. 「セマンティック」の意味を考える(cont.) 3. Power BIでは? Power BIでは、セマンティック レイヤーをその名のとおりセマンティック モデルで実現。 確かに、データソースとレポートの間に中間層として存在している。 ↑今日の主役 もっとセマンティック レイヤーを深堀しよう。 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
2.2. 人間クエリの限界 1. 生データの分析の困難さ ただのデータのままでは分析は困難。その理由は以下すべてに対応しなければならないから。 ① データのサイロ化 a. 複数のデータソース、b. 様々な形式のデータ(CSV、Excel、JSON等)、c. バラバラなGUI (or 統 一的に使えるSQLを覚える?)と、作業が複雑。 ② データの変換 データの内容やデータ粒度が基幹システムのためのものなので、変換しなければ分析できない。 ③ 膨大な作業パターン システム数Nとレポート数Mの組み合わせ N*M/2の作業パターンが生じる。一貫性維持が困難。 ④ 変更対応 データソースの変更、追加のたびに、上記すべてに再度対応。 ⑤ アクセス権管理 生データへの過剰なアクセス権付与(ex 個人情報がいらない人にも付与)、レポートのメール送付 の煩雑さ #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
2.2. 人間クエリの限界(cont.) 2. 人間クエリによる解決(ダメ!) 先の困難さをすべて解決するのが「人間クエリ」! 人間クエリとは、以下を備えた生ぬるいシス テムのこと。 ① 「こうやって」のあいまいな指示でデータ収集から集計、報告まで実行 ② 人間クエリは膨大な作業で力尽き、数字に興味を持てない ③ ルーチン以上の分析を行えない 分析の価値が向上しない ④ 人間クエリに残るのは疲労感だけで成長できない ⑤ 人間クエリは他の仕事を諦める 昔に比べ 業務範囲が拡大し、システムも増えているため、人間クエリの負担は激増している 人間クエリがダメなのではなく、こうやって人をすり潰していく組織/チームが問題 ! #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
2.3. セマンティック レイヤーによる解決 1. セマンティック レイヤーの機能 ① 一元的なアクセス すぐに分析可能 a. データのサイロ化(複数ソース、複数形式)を吸収。 b. 上流(データソース)の変化も吸収。下流(レポート)に影響しない。 c. ひとつのセマンティック レイヤーから複数レポートへ(作業パターンの減少) ② 簡易な操作 誰でも簡単に分析可能 ③ ビジネス上の意味付け 理解しやすい&正しいデータで柔軟な分析にも対応可能 分析に最適な形に変換されたデータ(列名、値を分かりやすいものに、分析上最適なエンティ ティで保持)。データ間の関連付け(リレーションシップ)。集計ロジックの提供。 ④ アクセス権管理 最低限のアクセス権を容易に付与 セマンティック レイヤー単位でアクセス権付与。グループウェアとも連携。 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
2.3. セマンティック レイヤーによる解決(cont.) 2. セマンティック レイヤーでより多くの分析が可能に セマンティック レイヤーで「すぐに&簡単に、正しいデータで分析可能に」になる。これにより、 ① 一人あたりの分析量を増加 セマンティックレイヤーがあれば、データ準備の煩雑さから解放される。より分析に注力でき ることから、一人あたりの分析量が増加。 ② 分析担当者の絶対数を増加 データ準備の煩雑さとその理解のハードルが解消するため、より多くの担当者がデータを分析 可能に。(何ならエグゼクティブ自らも可能) 組織全体でより多くのビジネス インサイトを得られるようになる。 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
2.3. Power BIのセマンティック モデル 1. セマン ティック モデルの機能 ① 一元的なアクセス セマンティック モデルはデータソースとレポートの中間に位置。モデル内に変換済みのデータ を保持(物理or論理)。セマンティック モデルからレポートを作成するため、レポート開発者 はデータソースを意識する必要がない。 ② 簡易な操作 ピボット テーブルの操作感で利用可能。SQL不要で自由な分析。 ③ ビジネス上の意味付け a. テーブルとリレーションシップ ファクト テーブルとディメンション テーブルに分解されたスター スキーマで、データ間の関係を把握可 能。ディメンション テーブルはグループ化の意味も。 b. 集計方法をメジャーで記述 c. 分かりやすい列名、列やメジャーの説明 ④ アクセス権の設定やRLS(行レベルセキュリティ)によるセキュリティ対応 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
2.3. Power BIのセマンティック モデル(cont.) 2. セマンティック モデルの活用 セマンティックモデル開発者が作成した、優れたセマンティックモデルがあればレポート作成 者は簡単にレポート作成が可能。「優れた」とは、現場ニーズに柔軟に対応可能で、しかもベ ストプラクティスに従っているもの。 3. 思ったこと ① セマンティック モデルは、組織に必要なグッド データを提供するもの。役割分担し、 より多くのインサイトを。 ② これら全部をSaaSで提供できるPower BIはつおい。でももっと強くできる(後述) #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
2.4. Power BIのセマンティック モデル(cont.) 4. でも簡単じゃない その効果が計り知れないセマンティック モデルであるが、作るのは大変。以下に対応しなければ ならないから: ① 様々なデータソースに対応 ② 現場ニーズに対応(複雑な集計ロジックもある)し柔軟性も持たせる(アドホック な分析にも対応) ③ ベスト プラクティスに準拠(適切なモデリング) ④ ETL、レポーティングそれぞれでパフォーマンスを調整 裏側のごちゃごちゃを全部整理して、便利かつ柔軟に使えるデータに整えるのだから、当然と言 えば当然。具体的なビジネスを抽象化していることもあり、難度が高くなる。何となくプログラ ミングに近いものを感じる(関数化、クラス設計、カプセル化的な) 。。 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
3. セマンティック モデル 活用戦略 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
3.1. 人材育成 1. 大まかな目標・原則 ① 役割分担で、データからの価値創出を最大化 ② 必要なペルソナは以下(重複可): a. プロジェクト マネージャー b. セマンティック モデル開発者 c. レポート開発者 d. ワークスペース管理者 ③ 重要なのはセマンティック モデル開発者とレポート開発者(いなければできない)。 a. 先述のとおりモデル開発が難しい b. レポート開発の難度は(技術的には)そこまで難しくない #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
3.1. 人材育成(cont.) 2. モデル、レポート開発者に必要なスキル 大事なのは相互の協力(どっちが偉いとかではなく)。人材育成を進めつつ最適なバランスの見極め を。 ① 1%以下:プロ級。Mashupエンジン、DAXのエンジン(FE、SE)を理解。手法の限界などの 評価を行った上で、ベスト プラクティスから外れたパフォーマンスの最適化も可能。 ② 2%以下:ベスト プラクティスに従ったモデリングが可能。DAXの評価コンテキストを完全 に理解。 ③ 5%以下:セマンティック モデル作成、ETL処理作成可能。DAXの評価コンテキストをある程 度理解。 ④ 10%以下:セマンティック モデルを理解した上で、レポート作成が可能。評価コンテキスト も少し理解。セマンティック モデル開発への意見を言える。 ⑤ 20%以下:レポートの作成が可能。ブックマーク等の各種テクニックに精通。 ⑥ 30%以下:簡単なレポート作成・修正が可能。 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
3.1. 人材育成(cont.) 3. 内製・アウトソースのバランスを考える ここも進めつつ自社に最適なバランスの見極めを。 ① 全部アウトソースは下の下 何を可視化するかを含めて外部に作らせるのはダメ。ビジネスの当事者が何を見たいのかわか らないのに、外部の人がわかるわけがない。 ② 内製化が望ましいけれど a. DAX(Dどう Aあがいても ×無理)だったりでまあまあ難しい。 b. ダッシュボード デザインに合わせて、モデルをアウトソースするのもありかもしれない。 c. 特に最上位レベルのスキルは知恵袋的に外部に協力も(取り合いになるけど) #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
3.1. 人材育成(cont.) 4. 実現に向けて CoE(Center of Excellence)のサポートが必要。個人・部署単位の取り組みでは無理。 ① 教育支援: 研修、勉強会を用意。 ② 開発支援: 特に立ち上がりフェーズを支援。質問対応も。 ③ 社内コミュニティ: 分散しているモデル開発者、レポート開発者同士をつなげる(特 に先述の③より上は人数が少ないので孤立しがち) モデル、レポートを作る人は業務の片手間。CoEのサポートだけでもまだ足りない。→次の次の セクションで #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
3.2. インフラ整備とシステム間連携 レポート作成はセマンティック モデルにより効率化。次は、セマンティック モデルの開発自体 をより効率化したい。そのために、さらなるインフラ整備とシステム間連携が必要。 1. Microsoft Fabricによるインフラ整備 Fabricは統合データ分析基盤を提供するSaaSで、セマンティック モデル開発の強化が可能。BI関 連機能だけで言えば: ① データ準備のData Engineering ② Direct Lakeモード ③ Semantic LinkによるBIワークロードとAI/MLワークロードの連携 正直、後発組としてはいろいろ揃えてくれていて助かる。 ただ、更に専門性が高まる(データ エンジニア等)ため、アウトソースするかは悩みどころ。 2. システム間連携 オンプレのデータソースとの連携は、システム開発や更改タイミングに合わせたりと長期化。関 係者も多くなる。 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
3.3. エグゼクティブ スポンサーシップ 1. 課題 ① 先の両ステップとも組織(部署)横断的 個別最適化に陥りがち。 ② 草の根的活動では限界(を感じてます) 単なる業務効率化と捉えられがち。ここはカルチャーの問題も。 なので、エグゼクティブのサポートが必要。 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
3.3. エグゼクティブ スポンサーシップ(cont.) 2. 解決策 ① 体制整備: 組織横断的な問題に対応 a. CDO(Chief Data Officer)設置: Digitalとかぼやけたことを言っていては時代遅れ。データ戦略 の策定と実行を。 b. 実行部隊のCoEを組成: これもDX推進とかぼやけた話ではなく。データ戦略としての実行部隊を。 ② データ カルチャーの変革 a. BI活用推進: 人間クエリによるExcel報告を根絶し、頻度高い&多角的BIレポートでPDCAを加速。 b. 人材育成 or 獲得 c. 専任化: 内製化には担当者自身の覚悟が必要。担当者を専任化し評価することで、このスキルに賭けて もいいと思わせるように。 d. 促し続ける: カルチャーの変革には時間がかかる。「何でこのデータ無いの?何で時間かかるの?」と ねちっこく言うしかない。 草の根的業務効率化と捉えていては進まない。現場の管理者もできることから始めないと。 人間クエリ扱いしていると、担当者から見限られますよ。 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP
Thank you for watching. Could you Please provide your feedback on this session and this event. ご視聴ありがとうございました! フィードバックにご協力ください Session survey Event survey 本セッションに対するアンケート イベント全体に対するアンケート 本セッションついて参考になった点や 感銘を受けた点、もっと知りたかったことなどをお寄せください。 運営チームメンバー、登壇者、サポートメンバーに対する 暖かいフィードバックをお待ちしております。 #GlobalPowerPlatformBootcamp #GPPB2025 #GPPB2025JP