アップロード
Open user menu
アップロード一覧
公開プロフィール
ユーザー設定
利用プラン
サインアウト
ログイン
新規登録
Open main menu
@undefined
プロフィールを編集する
アップロード
検索
人気
プログラミング
ビジネス
教育
ノウハウ
科学・技術
すべてのスライド
ログアウト
新規会員登録
ログイン
人気
プログラミング
ビジネス
教育
ノウハウ
科学・技術
すべてのスライド
検索
タグ #RLHF に関するスライド
検索
【大規模言語モデル入門Ⅱ】12章12.1
京都大学人工知能研究会KaiRA
267
【DL輪読会】Understanding the performance gap between online and offline alignment algorithms
Deep Learning JP
1.8K
【DL輪読会】Alignment Algorithms for Diffusion Models
Deep Learning JP
2.9K
【大規模言語モデル入門】4章4.4~4.6
京都大学人工知能研究会KaiRA
2K
【DL輪読会】Open Problems and Fundamental Limitations of Reinforcement Learning from Human Feedback
Deep Learning JP
11K
#RLHF
#強化学習
#大規模言語モデル
#DPO