对齐
为了让人工智能不会忘记图像,CoMemo 率先推出了下一代视觉和语言模型
为了让人工智能不会忘记图像,CoMemo 率先推出了下一代视觉和语言模 ...
让 LLM 代替人类当导师?用自然语言训练的强化学习代理
让 LLM 代替人类当导师?用自然语言训练的强化学习代理
[CoDi]可处理几乎所有模式的任意扩散模型
[CoDi]可处理几乎所有模式的任意扩散模型
扩散模型
法律硕士有创造力吗?
法律硕士有创造力吗?
对齐
情感计算的模型和数据集:情感识别的模型和数据集调查。
情感计算的模型和数据集:情感识别的模型和数据集调查。
调查
心灵之眼:利用模拟扩展提示,提高物理推理能力。
心灵之眼:利用模拟扩展提示,提高物理推理能力。
大型语言模型
ImageReward:基于学习文本到图像中人类评分的奖励模型。
ImageReward:基于学习文本到图像中人类评分的奖励模型。
对齐
利用人类评分反馈微调文本到图像模型
利用人类评分反馈微调文本到图像模型
对齐
RLHF:如何利用人类评分训练强化学习代理。
RLHF:如何利用人类评分训练强化学习代理。
对齐