[DL輪読会]Stochastic Neural Networks for Hierarchical Reinforcement Learning

>100 Views

February 22, 17

#deep learning #階層的強化学習 #確率的ニューラルネットワーク #強化学習 #ニューラルネットワーク #事前学習

スライド概要

2017/2/22
Deep Learning JP:
http://deeplearning.jp/seminar-2/

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

【DL輪読会】KAN: Kolmogorov–Arnold Networks

Deep Learning JP 84.7K

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

Deep Learning JP 59.4K

【拡散モデル勉強会】拡散モデルの数理

Deep Learning JP 54.1K

【拡散モデル勉強会】Introduction to Diffusion Models

Deep Learning JP 38.8K

【拡散モデル勉強会】拡散モデルのサンプラーまとめ

Deep Learning JP 33.3K

【DL輪読会】Cosmos World Foundation Model Platform for Physical AI

Deep Learning JP 31.9K

各ページのテキスト

STOCHASTIC NEURAL NETWORKS FOR HIERARCHICAL REINFORCEMENT LEARNING Carlos Florensa† , Yan Duan†‡, Pieter Abbeel†‡ 2017/2/10 発表者：金子貴輝

階層的強化学習 • 報酬を得るまでが長いタスクを分割したい • 従来法の問題 – タスクの分割に固有の知識を必要とする – タスク間で知識を共有せずサンプル効率が低い 2

問題設定 • 事前学習ができる • 状態空間が（共通，タスク固有）に分かれて相互作用が少ない – 例：把持タスクにおける対象物の位置 3

提案手法 • 確率的ニューラルネット – 同じ状況でも異なる行動を取れるので，状況の変化に対応できる • 相互情報量基準での正規化 – 新しい場所に行けば報酬になるらしい • タスク特徴の挿げ替えによる階層的RL – タスクを表す特徴で条件付けて事前学習 • 報酬は疎のままでいい – 固定ステップごとにone hotなタスク特徴を自作する上位のニューラルネット 4