スライド共有ならドクセル! スライド共有ならドクセル!
アップロード
アップロード一覧 公開プロフィール ユーザー設定 利用プラン
ログイン 新規登録
@undefined
プロフィールを編集する
アップロード
人気 プログラミング ビジネス 教育 ノウハウ 科学・技術 すべてのスライド
新規会員登録 ログイン
人気 プログラミング ビジネス 教育 ノウハウ 科学・技術 すべてのスライド

タグ #DPO に関するスライド

slide-thumbnail

【大規模言語モデル入門Ⅱ】12章12.1

user-img 京都大学人工知能研究会KaiRA 356
slide-thumbnail

【DL輪読会】Understanding the performance gap between online and offline alignment algorithms

user-img Deep Learning JP 1.9K
#RLHF
#DPO
#強化学習

運営:株式会社アプルーシッド

利用規約

プライバシーポリシー

サポート・お問合せ

マガジン

© 2021 Docswell. All rights reserved.