14.9K Views
May 08, 24
スライド概要
2024.05.08 PowerPlatform勉強会 #1 で清水がお話しした資料です
大学卒業後、未経験から .NET 系開発者としてソフトハウス → ITコンサルティング会社 → フリーランス → メーカー系SIerを経験。テクニカルアーキテクト。2022 年 7 月からフリーランスとして活動中。 2017 年 2 月に Microsoft MVP for Data Platform - Power BIを初受賞 (現在 6 回更新中)。Power BI 王子として認知されている。 2021 年 9 月、「Microsoft Power BI入門」(翔泳社)を出版。 最近の仕事は Power BI をエンドユーザーへ訴求 (レクチャー、研修、コンサルティング等) すること。コミュニティ活動と仕事の両面で行っている。
過去の資料 → https://www.slideshare.net/yugoes1021 最近の資料 → https://www.docswell.com/user/yugoes1021 Power BI を使うなら、スタースキーマは知っておこうね ~ for Power Platform users ~ 清水 優吾(しみず ゆうご) / テクニカル アーキテクト yugoes1021 @yugoes1021 Microsoft MVP for Data Platform - Power BI (2017.02 -) 2024-05-08 Power Platform 勉強会 #1
自己紹介 MVP: プロフィールページ 清水 優吾 (Yugo Shimizu) 個人事業主 Microsoft MVP for Data Platform – Power BI Technical Architect for BI & Data Platform https://bit.ly/PBIPrinceBook01 Data Platform をメインに活動をしている Technical Architect フリーランスとして Powe BI 関連のレクチャーやコンサル、セミナーをやっている 専門・興味: Data Platform (Azure) Power Platform (Power BI, Power Automate) Qiita: https://qiita.com/yugoes1021 Power BI 勉強会: https://powerbi.connpass.com Microsoft MVP for Data Platform Power BI (2017.02 - ) Japan Power BI User Group: https://www.facebook.com/groups/JapanPBUG/ YouTube: https://www.youtube.com/YugosRoom X(Twitter): @yugoes1021 Facebook: yugoes1021 LinkedIn: yugoes1021
スタースキーマについて話す理由 だってさ、Power BI って、データモデル が スタースキーマ に なっていることを 前提に 作られているんだもん。 つまり、スタースキーマにしていない場合、 Power BI のフル機能を使えないし、フルパフォーマンスは得られないの。 だから、すべての Power BI ユーザーは、スタースキーマについて、 知らなきゃいけない。これは 絶対 なの。
What is BI?
通常業務により自然と溜まるデータ データベース ダッシュボード レポート どこでも SEE 現場で DO Business Intelligence 現場で DO 現場へ GO 意 た思 め決 に定 の 会議で JUDGE
通常業務により自然と溜まるデータ データベース ダッシュボード レポート 現場で DO Business Intelligence 現場で DO どこでも SEE
通常業務により自然と溜まるデータ データベース ダッシュボード レポート Artificial Intelligence Business Intelligence 現場で DO 現場へ GO どこでも SEE 意 た思 め決 に定 の 会議で JUDGE
【フェーズ1】 システムからデータをフラットファイル(CSV、Excel)でダウンロード データをグラフ化して、ファイルを共有 可視化 DB 手動で ダウンロード 議論・判断 分析 全体のコストの80-90% 分析 現場へ
【フェーズ2】 システムと BI ツールを自動連携。定期的かつ必要なタイミングで最新 データがグラフ化され、分析や議論に適切な時間を費やすことができ、 繰り返し「試行」が可能となる 試行 可視化 議論・判断 自動連携 DB BI ツール 分析 現場へ 全体のコストの80-90%
【フェーズ3】 複数のシステムをデータソースとして DWH を構成、データを一元管理し て、BI ツールを自動連携。データがグラフ化され、分析や議論。 BI ツール SaaS 議論・判断 現場へ 自動連携 SNS DB DB DWH 可視化 分析
What is Power Platform?
Power Platform - Current Version (2022.09 -) - Teams Data Sources Power Platform dataflows Power Apps Power Automate ETL Power BI Power BI dataflows AI Builder Power Query Microsoft Dataverse Power Query Power Virtual Agents Azure Data Lake Storage Gen2 (ADLS) CDM folders Dynamics 365 ETL
Two Dataflows in Power Platform - Current Version (2020.09 -) Data Preparation Extract Transform Load Power Query Online Microsoft Dataverse Power Platform dataflows 分析エンティティのみ (Analytical entities only) AI Builder Automatic replication (Project Athena) CDM Folders Power BI dataflows Data Sources Machine Learning Cognitive Services Azure Azure Data Lake Storage Gen 2
What is Power BI?
Power BI Microsoft により提供されている BI のスイートサービス。セルフ サービスBI から エンタープライズBI まで、すべてをターゲットとし た データプラットフォーム。大容量の データ保存領域 や AI を内包。 レポートのオーサリングツールはデスクトップアプリケーションとして 提供され、その実行環境は SaaS のクラウドサービスとして提供さ れている。
Power BI Power BI Service https://appsource.microsoft.com / Azure AD CONNECT Power BI Apps (AppSource) ACCESS On-premises data gateway Multi devices Power BI Desktop On-premises data
Data Exploration Extract Power BI Service Report Transform DAX Load 発 行 Enterprise Semantic Models 保存 Power Query data sources Semantic Model Power BI Desktop Power BI File (PBIX)
Power BI Desktop Power BI Report Builder Data Exploration Enterprise Reporting Power BI Reports Data Gateways Security On-premises data gateway User Admin Cognitive Services Settings Paginated Reports Enterprise Semantic Models Semantic Models Data preparation ADLS Gen2 Power BI dataflows Cloud data sources On-premises data sources Power BI service AutoML AI / ML Power BI Admin
What is Star schema?
Star schema 「スタースキーマとは」って検索すると、いろんな記事に出会う ←Databricks「スタースキーマとは」より引用 https://www.databricks.com/jp/glossary/star-schema この記事は必見 僕の知る限り、これほどすっきり説明している記事は他にない
Star schema なお、Power BI の製品ドキュメントだとこちら ←「スタースキーマと Power BI におけるその重要性を理解する」より 引用 https://learn.microsoft.com/ja-jp/power-bi/guidance/star-schema この記事も必見 わからなくても、読む。何度も読む。定期的に読む。 きちんと経験を積んだ人は徐々に理解できるようになっていく
Star schema スタースキーマにするには、まずはデータを ディメンションテーブル と ファクトテーブル に分けます • ディメンション (Dimension) 次元や軸を意味する。いわゆるマスタデータから作成可能。商品マスタや従業員マスタなどを元に、一意 の Key (ID, コード) と 名称 を持たせる。その他の情報項目を列として持たせても OK • ファクト (Fact) 日々増えるトランザクションデータ。売上がその代表。事実としての業務の記録を意味する。ディメンション の Key、日付、集計対象の数値の3種類の値を保持する
Star schema 次に ディメンションテーブル と ファクトテーブル の間に リレーションシップを作成します • • • • ディメンションの Key と ファクトの Key を指定 ディメンション : ファクト = 1 : 多 ディメンション側が常に 1 であること フィルターの方向はディメンション→ファクト これらの要件は絶対に守る Dim 1 Dim 1 Dim 1 Fact 多 1 1 Dim Dim
より具体的に スタースキーマを見ていこう
スタースキーマを見ていこう データソース チュートリアル:Power BI Desktop で Excel ブックから魅力的なレポートを作成する https://docs.microsoft.com/ja-jp/power-bi/create-reports/desktop-excel-stunning-report
スタースキーマを見ていこう 今回のデータソース: Excel 上のテーブルひとつ
スタースキーマを見ていこう データソース: Excel Power Query エディター そのまま読み込むと、 Power BI 上でも テーブルがひとつになる。 Power BI Desktop
スタースキーマを見ていこう Power Query でデータを整形することで、スタースキーマにすることができる スタースキーマ
スタースキーマを見ていこう 周囲の 1 をディメンション、中心の 多 をファクトと呼ぶ 1 1 多 1 1 1 スタースキーマ
スタースキーマを見ていこう ディメンションのデータを見てみると… 1 Calendar 4 1 4 Product 2 Country 2 3 Discount Band 5 Segment 5 3 スタースキーマ
スタースキーマを見ていこう スターの中心をファクトと呼ぶ。ファクト=事実ということで、日々増える記録を意味する ファクトは以下のデータを保持する • ディメンションのキー • 日付 • 集計対象の値 上記を保持することで、1行が • いつ (When) • どこで (Where) • 誰が、誰の、誰を (Who) • 何を (What) • なぜ (Why) • どのように (How) と 5W1H を表すようになる What When Where Who How スタースキーマ
スタースキーマを見ていこう Financials テーブルに注目すると…
スタースキーマを見ていこう Financials テーブルに注目すると…
スタースキーマを見ていこう Financials テーブルに注目すると… もともと文字列で持っていた各カテゴリー値を Key に置き換えたことになる
スタースキーマを見ていこう 1. ディメンション キーと名称のペアを1組以上持ち、キーはユニークでなければならない 2. ファクト 5W1Hを表すように、日付、ディメンションのキー、集計対象の値を保持する 3. ディメンションとファクトの関係 ディメンション : ファクト = 1 : 多
デモ
まとめ スタースキーマを理解するのは簡単ではありません。難しいのです。 皆さんが難しさを感じるタイミングは、自社のデータを使用してスタースキーマにしようと取 り組んだ時です。おそらくサンプルデータのように上手くできないでしょう。 それがスタート です。 その時、2種類の人間に分けられます。 諦める人 と 諦めない人 です。 言わずもがな、どちらが優れている、というわけではありません。 ただ、あなたがどちらの道を選択するか、それだけです ※Power BI のレクチャーやコンサルティングのご用命、お待ちしております 連絡先