赶上最新的AI论文
什么是AI-SCHOLAR?
搜索历史
删除所有
登录
新注册
最新文章
从零开始学习人工智能
ゼロから学ぶ
图像识别
自然语言处理
语音识别
机器学习
深度学习
对抗性学习(GAN)
强化学习
采访
查看更多▼
TOP
RLHF
RLHF
在印度开发一个专门处理高中物理选择题的 LLM 聊天机器人
在印度开发一个专门处理高中物理选择题的 LLM 聊天机器人
09/09/2024
大型语言模型
[DPO]一种不使用强化学习,直接将大规模语言模型与用户偏好相匹配的方法
[DPO]一种不使用强化学习,直接将大规模语言模型与用户偏好相匹配的方 ...
02/02/2024
RLHF
EUREKA:利用 LLM 自动设计薪酬。
EUREKA:利用 LLM 自动设计薪酬。
04/12/2023
RLHF