对齐
[CoDi]可处理几乎所有模式的任意扩散模型
[CoDi]可处理几乎所有模式的任意扩散模型
扩散模型
法律硕士有创造力吗?
法律硕士有创造力吗?
对齐
情感计算的模型和数据集:情感识别的模型和数据集调查。
情感计算的模型和数据集:情感识别的模型和数据集调查。
调查
心灵之眼:利用模拟扩展提示,提高物理推理能力。
心灵之眼:利用模拟扩展提示,提高物理推理能力。
大型语言模型
ImageReward:基于学习文本到图像中人类评分的奖励模型。
ImageReward:基于学习文本到图像中人类评分的奖励模型。
对齐
利用人类评分反馈微调文本到图像模型
利用人类评分反馈微调文本到图像模型
对齐
RLHF:如何利用人类评分训练强化学习代理。
RLHF:如何利用人类评分训练强化学习代理。
对齐