最新AI論文をキャッチアップ
AI-SCHOLARとは?
検索履歴
すべて消去
ログイン
新規登録
新着記事
AIをゼロから学ぶ
ゼロから学ぶ
AIサービス
サービス
AIイベント
イベント
AI-TIMELY
画像認識
自然言語処理
音声認識
機械学習
深層学習
敵対的学習(GAN)
強化学習
インタビュー
もっと見る▼
TOP
RLHF
RLHF
【DPO】強化学習を用いずに大規模言語モデルをユーザの好みに直接合わせる手法
【DPO】強化学習を用いずに大規模言語モデルをユーザの好みに直接合わせ ...
2024年02月02日
RLHF
EUREKA:LLMを用いた報酬設計の自動化
EUREKA:LLMを用いた報酬設計の自動化
2023年12月04日
RLHF