アップロード
Open user menu
アップロード一覧
公開プロフィール
ユーザー設定
利用プラン
サインアウト
ログイン
新規登録
Open main menu
@undefined
プロフィールを編集する
アップロード
検索
人気
プログラミング
ビジネス
教育
ノウハウ
科学・技術
すべてのスライド
ログアウト
新規会員登録
ログイン
人気
プログラミング
ビジネス
教育
ノウハウ
科学・技術
すべてのスライド
検索
タグ #強化学習 に関するスライド
検索
箱庭ドローンの強化学習
hakoniwa
森崇
1.8K
【DL輪読会】 Gradient Informed Proximal Policy Optimization
Deep Learning JP
1K
【DeNA × AI Day】 自律型 AI が生み出す未来
dena ai day
DeNA_Tech
4.4K
【大規模言語モデル入門Ⅱ】12章12.1
京都大学人工知能研究会KaiRA
266
【DL輪読会】Understanding the performance gap between online and offline alignment algorithms
Deep Learning JP
1.8K
【DL輪読会】Alignment Algorithms for Diffusion Models
Deep Learning JP
2.9K
【DL輪読会】Simplifying Latent Dynamics with Softly State-Invariant World Models
Deep Learning JP
1.1K
【DL輪読会】1 π0: A Vision-Language-Action Flow Model for General Robot Control
Deep Learning JP
12.8K
【DL輪読会】PoliFormer: Scaling On-Policy RL with Transformers Results in Masterful Navigators
Deep Learning JP
2K
【大規模言語モデル入門】4章4.4~4.6
京都大学人工知能研究会KaiRA
2K
【DL輪読会】 Do Differentiable Simulators Give Better Policy Gradients?
Deep Learning JP
1.4K
【DL輪読会】LLM for Social Good
Deep Learning JP
1.5K
【DL輪読会】Behavior Generation with Latent Actions
Deep Learning JP
1.8K
【DL輪読会】Learning Reward for Robot Skills Using Large Language Models via Self-Alignment
Deep Learning JP
1K
【DL輪読会】HarmonyDream: Task Harmonization Inside World Models
Deep Learning JP
7.4K
KTO: Model Alignment as Prospect Theoretic Optimization (ICML2024 )
Deep Learning JP
4K
簡易的rpy2を作ってみた
株式会社ホクソエム
5.2K
【ゼロから作るDeap Learning】8.4~8.6
京都大学人工知能研究会KaiRA
230
【DL輪読会】Stop Regressing: Training Value Functions via Classification for Scalable Deep RL
Deep Learning JP
2.3K
Autonomous Evaluation and Refinement of Digital Agents
Deep Learning JP
1.6K
強化学習の基本と簡単な実装
強化学習
機械学習
Komiya
2.4K
Scaling Instructable Agents Across Many Simulated Worlds (1)
Deep Learning JP
1.5K
2024_収益向上を目指した強化学習ベースの蓄電池制御手法の検討
強化学習
蓄電池
太陽光発電
小平 大輔
1.9K
#強化学習
#大規模言語モデル
#RLHF
#機械学習
#深層学習
#LLM
#DPO
#自然言語処理
#世界モデル
« 前
次 »
1
2