【ゼロから作るDeep Learning】5.3-5.4

307 Views

June 23, 24

#誤差逆伝播法 #深層学習 #逆伝播 #Python #計算グラフ

スライド概要

京都大学人工知能研究会KaiRA

@kyoto-kaira

スライド一覧

AI・機械学習を勉強したい学生たちが集まる、京都大学の自主ゼミサークルです。私たちのサークルに興味のある方はX(Twitter)をご覧ください！

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

【論文読み会】GraphCast: Learning skillful medium-range global weather forecasting

京都大学人工知能研究会KaiRA 29K

【論文読み会】NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

京都大学人工知能研究会KaiRA 21.7K

【IT Text 自然言語処理の基礎】第7章：事前学習済みモデルと転移学習

京都大学人工知能研究会KaiRA 17.6K

【物体検出】ResNet・EfficientNet (v2)

京都大学人工知能研究会KaiRA 15.6K

【Pythonで学ぶ音声認識】第5章：GMM-HMMによる音声認識（5.5節）

京都大学人工知能研究会KaiRA 11.6K

【Pythonで学ぶ音声認識】第5章：GMM-HMMによる音声認識（5.3節まで）

京都大学人工知能研究会KaiRA 11.3K

各ページのテキスト

2024年度前期輪読会#7「ゼロから作る Deep Learning」５章誤差逆伝播法 5.3～5.4 京都大学理学部二回生駒井暁 0

誤差逆伝播法目次 1. 加算ノードの逆伝播 2. 乗算ノードの逆伝播 3. 加算・乗算レイヤの実装 4. まとめ 1

1. 加算ノードの逆伝播 2

1.加算ノードの逆伝播表式 ● ２つの入力の和を出力とする局所的な計算（加算ノード）で逆伝播はのときなので、下流側の微分値に１を掛けた値が上流側に伝播していく。 3

2. 便利なテンプレ集計算例 ● 順伝播が入力値10と5の加算の場合、逆伝播は下流側の信号(今回は1.3)をそのまま上流側に伝えるだけ。 ● どの加算でも逆伝播は同じ計算になる。 4

2. 乗算ノードの逆伝播 5

2. 乗算ノードの逆伝播表式 ● ２つの入力の和を出力とする局所的な計算（加算ノード）で逆伝播はのときなので、下流側の微分値に順伝播時の入力値をひっくり返した値を掛けた値が上流に伝播していく。 6

2. 乗算ノードの逆伝播例 ● 順伝播が入力値10と5の乗算の場合、逆伝播は出力側の信号である1.3に、5と10をそれぞれ掛けた値が上流に伝わる。 ● 加算ノードとは異なり、微分値が順伝播での入力値に依ってしまう。 7

3. 加算・乗算レイヤの実装 8

10.

3. 加算・乗算レイヤの実装リンゴ2個とみかん3個の買い物についての下図の状況での逆伝播を実装してみよう。最終的な支払金額は加算と乗算の組み合わせで成り立っている。右向きの矢印:順伝播の信号左向きの矢印:逆伝播の信号 9

11.

3. 加算・乗算レイヤの実装乗算レイヤの実装 class MulLayer: def __init__(self): self.x = None self.y = None def forward(self, x, y): self.x = x self.y = y out = x * y #後で値を代入するため初期化 #順伝播の信号を記憶 return out def backward(self, dout): dx = dout * self.y dy = dout * self.x return dx, dy 10

12.

3. 加算・乗算レイヤの実装加算レイヤの実装 class AddLayer: def __init__(self): pass #初期化を行う必要はない def forward(self, x, y): out = x + y return out def backward(self, dout): dx = dout * 1 dy = dout * 1 return dx, dy return dx, dy 11

13.

3. 加算・乗算レイヤの実装買い物における計算グラフ apple = 100 apple_num = 2 orange = 150 orange_num = 3 tax = 1.1 # layer mul_apple_layer = MulLayer() mul_orange_layer = MulLayer() add_apple_orange_layer = AddLayer() mul_tax_layer = MulLayer() # forward apple_price = mul_apple_layer.forward(apple, apple_num) # (1) orange_price = mul_orange_layer.forward(orange, orange_num) # (2) all_price = add_apple_orange_layer.forward(apple_price, orange_price) price = mul_tax_layer.forward(all_price, tax) # (4) # (3) # backward dprice = 1 dall_price, dtax = mul_tax_layer.backward(dprice) # (4) dapple_price, dorange_price = add_apple_orange_layer.backward(dall_price) dorange, dorange_num = mul_orange_layer.backward(dorange_price) # (2) dapple, dapple_num = mul_apple_layer.backward(dapple_price) # (1) # (3) print("price:", int(price)) print("dApple:", dapple) print("dApple_num:", int(dapple_num)) print("dOrange:", dorange) print("dOrange_num:", int(dorange_num)) print("dTax:", dtax) 12

14.

誤差逆伝播法 4.まとめまとめ１加算ノードでの逆伝播は下流の信号はそのまま上流に送られる。乗算ノードでの逆伝播は下流の信号に、順伝播値の入力信号をひっくり返した値まとめ２を掛けた値が上流に送られる。加算ノードとは異なり、順伝播時の値を覚えておかなければならない。まとめ３全体で見れば複雑な計算も局所的な問題に切り替えれば、対応するレイヤを実装することで計算を単純化できる。 13

15.