【グラフニューラルネットワーク】2.3

1.4K Views

May 09, 24

#グラフニューラルネットワーク #グラフ機械学習 #ラベル伝搬法 #行列分解 #Deep Walk

スライド概要

京都大学人工知能研究会KaiRA

@kyoto-kaira

スライド一覧

AI・機械学習を勉強したい学生たちが集まる、京都大学の自主ゼミサークルです。私たちのサークルに興味のある方はX(Twitter)をご覧ください！

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

【論文読み会】GraphCast: Learning skillful medium-range global weather forecasting

京都大学人工知能研究会KaiRA 28.8K

【論文読み会】NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

京都大学人工知能研究会KaiRA 21.2K

【IT Text 自然言語処理の基礎】第7章：事前学習済みモデルと転移学習

京都大学人工知能研究会KaiRA 17K

【物体検出】ResNet・EfficientNet (v2)

京都大学人工知能研究会KaiRA 14.4K

【Pythonで学ぶ音声認識】第5章：GMM-HMMによる音声認識（5.5節）

京都大学人工知能研究会KaiRA 11.2K

【Pythonで学ぶ音声認識】第5章：GMM-HMMによる音声認識（5.3節まで）

京都大学人工知能研究会KaiRA 10.9K

各ページのテキスト

グラフニューラルネットワーク第２章３節古典的なグラフ機械学習⼿法京都⼤学医学研究科 M1 ⼩林侑⼤ 0

2.古典的なグラフ機械学習⼿法⽬次 1. ラベル伝搬法ー転導的頂点⼆値分類問題 2. ⾏列分解 3. Deep Walk 1

[beta]

2.3 古典的なグラフ機械学習⼿法

2.3.1ラベル伝搬法

転導的頂点⼆値分類問題
𝑉# :ラベル既知頂点

𝑉! :ラベル未知頂点

0

1 𝑤

(

?

𝑤'

𝑤$

0

?
𝑤 -

予測

%

𝑤&

?

0 or 1

•

重みは類似度を表す。

•

⽬的は類似度をもとに頂点のラベル
るを予測すること。
→例えば、𝑤! が⼤きい場合、
?" を 0と予測できれば良い

⼊⼒︓重み付きグラフ ( 𝐺 = 𝑉, 𝐸, 𝑤 )
出⼒︓教師ラベルの付いていない頂点 𝑉!
について、ラベルの推定値 )
𝑦" (0か1) を求める。

2

2.3 古典的なグラフ機械学習⼿法 2.3.1 ラベル伝搬法解くべき最適化問題求めたい 0 1𝑊 𝑊$% $) ? 𝑊$( 0 𝑊$& ? • (𝒇 ∈ ℝ# ) は頂点のラベルの推定値を表すベクトル • 予測値は、𝒇𝒗 ≥ 0.5であれば , 𝑦% = 1 とし、𝒇𝒗 < 0.5であれば , 𝑦% = 0 とする。 • 類似度が⼤きい頂点が重要視される • 類似度が⼤きい頂点同⼠は同じラベルになる。 𝑊$' ? 3

2.3 古典的なグラフ機械学習⼿法 2.3.1 ラベル伝搬法ラベル伝搬法の解⽬的関数の最⼩値を求めれば良いので、⽬的関数を 𝑓& について偏微分して未知既知頂点のラベルの推定値で未知のものの集合𝑓' を、既知のものの集合 𝑓( だけで表せた︕ 勾配の式を0で解くと最終的に式(2.28)のように解ける。 4

2.3 古典的なグラフ機械学習⼿法 2.3.1 ラベル伝搬法ランダムウォークを⽤いた解釈ラベル伝搬法の解𝑓% は頂点𝑣から初めて訪れた教師付きラベルが１である確率𝑞% ∈ 0,1 と⼀致する。 0 𝑣 𝑊%) deg 𝑣 𝑢 • 類似度が⼤きい辺ほど⾼い確率で渡っていく。 • deg 𝑣 は頂点(𝑣) に接続しているエッジの重みの合計 • ラベル伝搬法は近くにある頂点同⼠が同じラベルになるように分類される。 • 式(2.30)と式(2.25)は等価 𝑞と𝑓も⼀致。 0 𝑣 𝑞" 0 1 1 5

2.3 古典的なグラフ機械学習⼿法 2.3.2 ⾏列分解教師なし頂点表現学習問題 • 埋め込み(embedding)︓データの情報を低次元のベクトルとして表現したもの • 表現学習︓埋め込みを学習する • 重み付きグラフの接続⾏列 𝐵&* は頂点の埋め込みになっている。頂点の埋め込み Z" ∈ ℝ, 𝑣 𝑢 頂点の埋め込み Z- ∈ ℝ, 𝑍-. Z" → 辺uvの構造の情報 𝑍". Z" → 頂点vの構造の情報みたいに表せたら嬉しい。⼊⼒︓重み付きグラフ ( 𝐺 = 𝑉, 𝐸, 𝑤 ) 出⼒︓グラフ構造を考慮した頂点の埋め込みZ ∈ ℝ*×, 6

2.3 古典的なグラフ機械学習⼿法 2.3.2 ⾏列分解教師なし頂点表現学習問題解くべき最適化問題 • この問題ではスペクトル分解と特異値分解どちらでも同じ解となる • 分かりやすそうなサイトグラフの構造の情報と頂点の埋め込みの積を近づけていくこのような問題は⾏列分解により解くことができる。 • ・スペクトル分解→固有値を利⽤した分解・特異値分解→特異値を利⽤した分解この問題の解↓ • スペクトル分解 https://qiita.com/jamojisan/ite ms/b8f7a7e9b44fc3e2e41c 特異値分解︓ https://qiita.com/kidaufo/items/ 0f3da4ca4e19dc0e987e 7

2.3 古典的なグラフ機械学習⼿法 2.3.2 ⾏列分解トピック推定⽂書と単語の関係性を埋め込む解くべき最適化問題⼊⼒：単語の集合 {𝑤$ , 𝑤% , … , 𝑤/ } 出⼒︓各⽂書 𝑡0 のトピックの割当変量 𝑈0 ∈ ℝ, (𝑖 ∈ 𝑇 ) 各単語 𝑤0 のトピックの割当変量 𝑉0 ∈ ℝ, (𝑖 ∈ 𝑊 ) 𝑋& ∈ ℝ+ は𝑏𝑎𝑔 𝑜𝑓 𝑤𝑜𝑟𝑑𝑠といい、𝑋&* ∈ ℝは⽂書𝑡& 中に単語𝑤* が出現する回数を表す。この最適化問題は特異値分解で解くことができ、このような解析⼿法を潜在意味解析という。 8

10.

2.3 古典的なグラフ機械学習⼿法 2.3.2 ⾏列分解映画推薦問題解くべき最適化問題⼊⼒：ユーザーの映画の評価履歴 {(𝑢0 , 𝑣1 , 𝑟01 )} 出⼒︓各ユーザーに対するおすすめの映画ユーザーと映画の埋め込みを計算した後は、各ユーザー𝑢& が未評価の映画𝑣* につけるであろう評価値を , 𝑟&* = 𝑈&, 𝑉& として推定することができる。この評価値が最も⾼い未評価の映画をユーザー 𝑢& に推薦する。このように傾向の似た他のユーザーの消費した品⽬に基づいて推薦を⾏う技法を協調フィルタリングという 9

11.

2.3 古典的なグラフ機械学習⼿法 2.3.3 Deep Walk 教師なし頂点表現学習問題 A ⼊⼒︓重み付きグラフ ( 𝐺 = 𝑉, 𝐸, 𝑤 ) 出⼒︓グラフ構造を考慮した頂点の埋め込みZ ∈ ℝ*×, A B B C C D 頂点𝑢の周辺という条件のもとでの頂点𝑣の出現確率を 𝑝∗(𝑣|𝑢)とあらわす。 F G F G E E ランダムウォーク：モデルのもとで、頂点𝑣が頂点𝑢の周囲い登場する確率を D A 私 C の F 名前 E は Aの周辺と定義する。うまく学習できると、頂点𝑣と頂点𝑢の類似度がわかる︕ 10

12.

2.3 古典的なグラフ機械学習⼿法 2.3.3 Deep Walk 教師なし頂点表現学習問題最⼤化する⽬的関数真の頂点𝑢周辺の頂点𝑣の出現確率と予測した頂点𝑢周辺の頂点𝑣の出現確率を近づけていく • KLはカルバック・ライブラー情報量 (Kullback-Leibler divegrence) であり、⾮負で2つの確率分布が等しいかつその時のみ０となる。簡単⾔えば、2つの確率分布の距離のような意味を持つ。最適化の⼿法は確率的勾配向上法を⽤いて⾏うこのままでは、(2.57)の分⺟の計算が⼤変なので、それを避けるための⽅法としてネガティブサンプリングが紹介されていた。 11