文章
RStar2-Agent:通过基于 GRPO-RoC 的高效代理强化学习实现最先进的数学推理
RStar2-Agent:通过基于 GRPO-RoC 的高效代理强化学 ...
Pref-GRPO:通过成对比较实现稳定文本图像生成强化学习的新方法
Pref-GRPO:通过成对比较实现稳定文本图像生成强化学习的新方法
TRACEALIGN:追踪大规模语言模型对齐漂移的原因和保护措施
TRACEALIGN:追踪大规模语言模型对齐漂移的原因和保护措施
AlignGuard-LoRA:一种结合了高效微调和安全保护的新正则化方法
AlignGuard-LoRA:一种结合了高效微调和安全保护的新正则化 ...
ChartCap:利用大型数据集和新的评估指标抑制图表标题幻觉
ChartCap:利用大型数据集和新的评估指标抑制图表标题幻觉
LAMIC:一种无需学习、布局可控的多参考图像生成方法
LAMIC:一种无需学习、布局可控的多参考图像生成方法
LiveMCPBench:在大型工具环境中评估 LLM 代理的新基准
LiveMCPBench:在大型工具环境中评估 LLM 代理的新基准
Goedel-Prover-V2:通过自我修正和逐步数据合成实现高效自动定理证明的新发展
Goedel-Prover-V2:通过自我修正和逐步数据合成实现高效自 ...
多人对话视频生成的新发展:麻省理工学院数据集和基线模型 "CovOG"
多人对话视频生成的新发展:麻省理工学院数据集和基线模型 "CovOG"
ToolTrain:利用 LLM 进行资源库深度搜索和问题定位的新方法
ToolTrain:利用 LLM 进行资源库深度搜索和问题定位的新方法
启用 FlashAttention 的令牌压缩 "表象移动 "的工作原理和效果
启用 FlashAttention 的令牌压缩 "表象移动 "的工作原 ...
CRINN:通过强化学习自动优化近似近邻算法
CRINN:通过强化学习自动优化近似近邻算法
CompassVerifier:彻底改变 LLM 解决方案验证的新基准和稳健模型
CompassVerifier:彻底改变 LLM 解决方案验证的新基准 ...
LongVie:通过多模式控制实现一分钟超高质量视频生成的新时代
LongVie:通过多模式控制实现一分钟超高质量视频生成的新时代
Skywork UniPic:新一代多模态模型,集图像理解、生成和编辑于一体,效率极高
Skywork UniPic:新一代多模态模型,集图像理解、生成和编辑 ...
种子扩散预览:兼具快速推理和高性能的下一代代码生成模型
种子扩散预览:兼具快速推理和高性能的下一代代码生成模型
MATE:多代理无障碍模式转换框架
MATE:多代理无障碍模式转换框架
小波扩散:最快的扩散模型
小波扩散:最快的扩散模型
生成图像
利用 ChatGPT 提高面部识别的准确性和透明度,这是软性生物识别技术的新发展
利用 ChatGPT 提高面部识别的准确性和透明度,这是软性生物识别技 ...
大型语言模型
[RL-GPT]在 Mincraft 中以比平常快几倍的速度获取钻石的框架现已推出
[RL-GPT]在 Mincraft 中以比平常快几倍的速度获取钻石的 ...
机器学习
现在有了一个框架,可以让法律硕士使用 MBTI 评估人的个性!
现在有了一个框架,可以让法律硕士使用 MBTI 评估人的个性!
聊天室GPT
VCRL:利用奖励差异控制学习难度的 LLM 强化学习新方法
VCRL:利用奖励差异控制学习难度的 LLM 强化学习新方法
从记忆到检索的 LLM:工具内学习的理论优势和证据
从记忆到检索的 LLM:工具内学习的理论优势和证据
简单!准确度高!异常检测模型PatchCore的吸引力
简单!准确度高!异常检测模型PatchCore的吸引力
目标检测
优于ViT!大规模CNN的新基本模型!:InternImage
优于ViT!大规模CNN的新基本模型!:InternImage
深度学习
针对体育博彩中足球比赛预测挑战的机器学习模型
针对体育博彩中足球比赛预测挑战的机器学习模型
体育分析
[DPO]一种不使用强化学习,直接将大规模语言模型与用户偏好相匹配的方法
[DPO]一种不使用强化学习,直接将大规模语言模型与用户偏好相匹配的方 ...
RLHF
FakeParts:一个新的基准,揭示了部分深度伪造的威胁和检测极限
FakeParts:一个新的基准,揭示了部分深度伪造的威胁和检测极限
Social-MAE 是一种社交人工智能,它利用自我监督学习来解读情绪、笑声和个性
Social-MAE 是一种社交人工智能,它利用自我监督学习来解读情绪 ...
ImmerseGen:由代理引导的、轻量级的、高度逼真的下一代虚拟现实场景生成
ImmerseGen:由代理引导的、轻量级的、高度逼真的下一代虚拟现实 ...
[Qwen2-VL] 可处理不同分辨率图像和视频的最新 VLM
[Qwen2-VL] 可处理不同分辨率图像和视频的最新 VLM
大型语言模型