赶上最新的AI论文

什么是AI-SCHOLAR？

[SCoRe]强化学习，提高 LLM 自我纠错能力！在多步骤过程中发现和纠正错误

[SCoRe]强化学习，提高 LLM 自我纠错能力！在多步骤过程中发现 ...

31/10/2024 大型语言模型

模特们自己奖励自己，自己训练自己！

模特们自己奖励自己，自己训练自己！

28/07/2024 自我奖励