September 25, 19
2019/9/25-6に開催されたUnite Tokyo 2019の講演スライドです。
酒本 幹夫(インテル株式会社)
酒本幹夫 インテル株式会社
アジェンダ • イントロ • ゲームのプロファイリング手順概要 • プロファイリング手順のステップ • 一般的なボトルネックの特定方法 • ケース・スタディー:Unityの3Dゲームキットを最適化 • GPAを使ったパフォーマンス解析の参考になるレシピ @IntelSoftware @IntelGraphics 2
効果的なグラフィックス・パフォーマンスのスケーリング 30 FPS わたしの イカした ゲーム @IntelSoftware @IntelGraphics 3
効果的なグラフィックス・パフォーマンスのスケーリング 30 FPS わたしの イカした ゲーム @IntelSoftware 10 FPS @IntelGraphics 4
効果的なグラフィックス・パフォーマンスのスケーリング 30 FPS わたしの イカした ゲーム @IntelSoftware 10 FPS @IntelGraphics 20 FPS 5
効果的なグラフィックス・パフォーマンスのスケーリング わたしの イカした ゲーム @IntelSoftware 30 FPS 30 FPS 10 FPS 20 FPS @IntelGraphics 6
効果的なグラフィックス・パフォーマンスのスケーリング わたしの イカした ゲーム @IntelSoftware 30 FPS 60 FPS+ 10 FPS 30 FPS+ @IntelGraphics 7
インテル® グラフィックス・パフォーマンス・アナライザー (Intel GPA) System Analyzer @IntelSoftware Graphics Frame Analyzer @IntelGraphics Graphics Trace Analyzer 8
プロファイリング手順 CPU バウンド シーンの特定 + CPU vs GPU バウンド? トレース・アナライザーでホット・スポット解析 + フレーム解析 ホット・スポットの特定 GPU バウンド @IntelSoftware @IntelGraphics 9
プロファイリング手順 CPU バウンド シーンの特定 + CPU vs GPU バウンド? トレース・アナライザーでホット・スポット解析 + フレーム解析 ホット・スポットの特定 GPU バウンド @IntelSoftware @IntelGraphics 10
プロファイリング手順 CPU バウンド シーンの特定 + CPU vs GPU バウンド? トレース・アナライザーでホット・スポット解析 + フレーム解析 ホット・スポットの特定 GPU バウンド @IntelSoftware @IntelGraphics 11
システム・アナライザー概要 @IntelSoftware @IntelGraphics 12
アプリケーション実行中のライブ解析 @IntelSoftware @IntelGraphics 13
プロファイリング手順 CPU バウンド シーンの特定 + CPU vs GPU バウンド? トレース・アナライザーでホット・スポット解析 + フレーム解析 フレーム解析 Frame Analysis ホット・スポットの特定 GPU バウンド @IntelSoftware @IntelGraphics 14
グラフィックス・トレース・アナライザー • 改善されたデータ収集メカニズ ムと、新しいUI • 1つのタイムラインで関連付け られたさまざまなソースから データを収集 • ETWイベント • グラフィックスAPIコール • サンプリングされたメトリック (数値) @IntelSoftware @IntelGraphics 15
グラフィックス・コマンドの発行から終了まで Hardware Queue Driver Queue Graphics API calls @IntelSoftware @IntelGraphics 16
グラフィックス・コマンドの発行から終了まで Hardware Queue Driver Queue Graphics API calls 最終的にGPUで実行されるまでキューが存在し続ける @IntelSoftware @IntelGraphics 17
グラフィックス・コマンドの発行から終了まで キューにすき間が無い Hardware Queue Driver Queue Graphics API calls @IntelSoftware @IntelGraphics 18
GPUバウンドではない Hardware Queue Driver Queue Graphics API calls @IntelSoftware @IntelGraphics 19
GPUバウンドではない Hardware Queue Driver Queue Graphics API calls キューにすき間がある @IntelSoftware @IntelGraphics 20
VSync バウンド @IntelSoftware @IntelGraphics 21
GPU バウンド vs CPU バウンド 比較 GPUキュー内 の一貫した ストリーム? Yes GPU バウンド No フレームタイ ム< VSync? Yes VSync バウンド GPU バウンド No GPUキューに 一貫した ギャップは? Yes 複合要因 No @IntelSoftware CPU バウンド @IntelGraphics GPU バウンドではない 22
アプリケーションごとのGPU使用率を区別する @IntelSoftware @IntelGraphics 23
プロファイリング手順 CPU バウンド シーンの特定 + CPU vs GPU バウンド? トレース・アナライザーでホット・スポット解析 + フレーム解析 フレーム解析 Frame Analysis ホット・スポットの特定 GPU バウンド @IntelSoftware @IntelGraphics 24
CPU バウンド CPU バウンド シーンの特定 + CPU vs GPU バウンド? トレース・アナライザーでホット・スポット解析 + フレーム解析 フレーム解析 ホット・スポットの特定 GPU バウンド @IntelSoftware @IntelGraphics 25
インスツルメンテーション インスツルメンテーションの 他の選択肢 • ETW • PIX/Graphics API markers 選択された領域のホット・ス ポット 特定の領域を詳細調査 @IntelSoftware @IntelGraphics 26
プロファイリング手順 CPU バウンド シーンの特定 + CPU vs GPU バウンド? トレース・アナライザーでホット・スポット 解析 + フレーム解析 Frame Analysis ホット・スポットの特定 GPU バウンド @IntelSoftware @IntelGraphics 27
GPU バウンド CPU バウンド シーンの特定 + CPU vs GPU バウンド? トレース・アナライザーでホット・スポット解析 + フレーム解析 ホット・スポットの特定 GPU バウンド @IntelSoftware @IntelGraphics 28
グラフィックス・フレーム・アナライザー @IntelSoftware @IntelGraphics 29
GPUバウンド • もっとも負荷の高いコールを特定するためのフレーム解析 • 根本要因を自動判定する分析機能をもつ、かんたんホット・スポット解析 フレーム解析 ホット・スポットの特定 GPU bound @IntelSoftware @IntelGraphics 30
もっとも負荷の高いコールを特定する ボトムアップ・アプローチ @IntelSoftware @IntelGraphics 31
もっとも負荷の高いコールを特定する トップダウン・アプローチ @IntelSoftware @IntelGraphics 32
ホット・スポット解析概要 @IntelSoftware @IntelGraphics 33
Geometry Transformation(ジオメトリー変換) • Geometry Transformationボトルネック • 注意することと対策: • 小さな領域にレンダリングされた密なジオメトリー • • 氷山の一角 (5%見えてて 95%見えてない) • • よりアグレッシブなLOD、またはデシメーションが必要 な可能性あり より効率的なカリングのためにジオメトリーをスライス する はぐれ者 (カリングされてないけど見えてない) • オブジェクトがなぜカリングされてないか要デバッグ @IntelSoftware @IntelGraphics 34
Geometry Transformation(ジオメトリー変換) • X軸:レンダーされたピクセル • Y軸:プリミティブ・カウント • 高く細いバー、小さなピクセルにレンダリングされた大きなオブジェクト @IntelSoftware @IntelGraphics 35
Geometry Transformation(ジオメトリー変換) 氷山の一角 @IntelSoftware はぐれ者 @IntelGraphics 密/氷山 36
Geometry Transformation(ジオメトリー変換) • 新しいPythonプラグインシステム • =metric(“GPU Duration”, “>”, 200) • いくつかのプラグインは同梱済み • 自作可能! @IntelSoftware @IntelGraphics 37
プロファイリング手順 CPU バウンド シーンの特定 + CPU vs GPU バウンド? トレース・アナライザーでホット・スポット解析 + フレーム解析 ホット・スポットの特定 GPU バウンド @IntelSoftware @IntelGraphics
ケース・スタディー: Unity 3D Game Kit 概要 Unityアセット・ストアにあるチュートリアル・プロジェクト 3つのビルトイン設定‘Performance’、‘Balanced’、‘Fantastic’ 今回のゴール: ‘Performance’ モード FPS を‘Fantastic’ モードの画像品質で @IntelSoftware @IntelGraphics 39
ケース・スタディー: Unity 3D Game Kit 差分を見つける 何が”Fantastic”を”Performance”よりも見栄え良くしているのか? @IntelSoftware @IntelGraphics 40
ケース・スタディー: Unity 3D Game Kit パフォーマンスのゴールを決める 何が”Fantastic”を”Performance”よりも見栄え良くしているのか? 遠景の描画 @IntelSoftware @IntelGraphics 水の反射 影 41
ケース・スタディー: Unity 3D Game Kit 改善例 何が”Fantastic”を”Performance”よりも見栄え良くしているのか? 遠景の描画 @IntelSoftware @IntelGraphics 水の反射 影 42
ケース・スタディー: Unity 3D Game Kit どうやったか? 品質vs性能の綱引き、描画量を増やすための余力を作り出す @IntelSoftware @IntelGraphics 43
ケース・スタディー: Unity 3D Game Kit ゲームの構造を理解する @IntelSoftware @IntelGraphics 44
ケース・スタディー: Unity 3D Game Kit ゲームの構造を理解する フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 45
ケース・スタディー: Unity 3D Game Kit スカイボックスが3msかかってる? ~フレーム予算の10% フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 46
ケース・スタディー: Unity 3D Game Kit スカイボックスの描画を調査 @IntelSoftware @IntelGraphics ~フレーム予算の10% 47
ケース・スタディー: Unity 3D Game Kit スカイボックスの描画を調査 @IntelSoftware @IntelGraphics ~フレーム予算の10% 48
ケース・スタディー: Unity 3D Game Kit スカイボックスのデファラード描画 ~フレーム予算の10% フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 49
ケース・スタディー: Unity 3D Game Kit スカイボックスをフォワード描画で0.8msに ~フレーム時間の10%から2.4%に改善! フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 50
ケース・スタディー: Unity 3D Game Kit 玉ねぎの皮をどんどんむいていこう フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 51
ケース・スタディー: Unity 3D Game Kit ~フレーム予算の14.5% 反射描画に4.8ms フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 52
ケース・スタディー: Unity 3D Game Kit 反射描画を調査 @IntelSoftware @IntelGraphics 53
ケース・スタディー: Unity 3D Game Kit 32反射プローブ? もうちょっと少なくできるか? ~フレーム予算の14.5% フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 54
ケース・スタディー: Unity 3D Game Kit 32から3に反射プローブを減らして2.1ms 14.5%から6.4%のフレーム予算に削減! フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 55
ケース・スタディー: Unity 3D Game Kit 玉ねぎの皮をどんどんむいていこう フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 56
ケース・スタディー: Unity 3D Game Kit UI 描画に 1.8msかかっている ~フレーム予算の8% フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 57
ケース・スタディー: Unity 3D Game Kit UI レンダリングを調査 @IntelSoftware @IntelGraphics 58
ケース・スタディー: Unity 3D Game Kit テキストのぼかしは高負荷、どのくらい? ~フレーム予算の8% フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 59
ケース・スタディー: Unity 3D Game Kit ぼかし無しのUIレンダリングで0.2ms フレーム予算の8%から0.6%へ改善! Frame Budget (30 FPS) @IntelSoftware @IntelGraphics 60
ケース・スタディー: Unity 3D Game Kit 確認してみよう:38FPSになった! これらの最適化 の結果、38FPS に動作を改善 今度は省略され てしまっていた ものを戻し始め よう 大物からやって みる:遠景のカ リング フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 61
ケース・スタディー: Unity 3D Game Kit 遠景のカリングを復元 前 38FPS 後 33FPS まだ余裕がある もっと増やして みよう フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 62
ケース・スタディー: Unity 3D Game Kit いっきに全部戻し! 前 33FPS 後 28FPS 8%予算を超えた が、水の反射と影 が復活! 予算に収まる範囲 内で、手軽にでき ることは? フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 63
ケース・スタディー: Unity 3D Game Kit デファラード・レンダー・ターゲットをダウン・スケール デファラード・レ ンダー・ターゲッ トを元のサイズが からダウン・ス ケール 最終段のパスで アップ・スケール し、UIをフル解像 度で描画 もとのフレーム予 算に戻った! フレーム予算 (30 FPS) @IntelSoftware @IntelGraphics 64
他のレシピ フレーム・キャプチャーをトリガー実行 @IntelSoftware @IntelGraphics 65
他のレシピ ストリームのキャプチャー @IntelSoftware @IntelGraphics 66
他のレシピ ストリームのキャプチャー @IntelSoftware @IntelGraphics 67
他のレシピ ストリームのキャプチャー @IntelSoftware @IntelGraphics 68
他のレシピ アドバンスド・プロファイリング・モード @IntelSoftware @IntelGraphics 69
他のレシピ カウンター固定機能 @IntelSoftware @IntelGraphics 70
他のレシピ カウンターの比較 @IntelSoftware @IntelGraphics 71
まとめ • 効率的にグラフィックスの性能をスケールさせよう • パフォーマンスに配慮することは全員の任務 • インテル® GPAを無料でゲット @ https://software.intel.com/en-us/gpa • 遠慮なく終了後私に質問をどうぞ • ご自身の手でお試しください! @IntelSoftware @IntelGraphics 72
