文章
RStar2-Agent:通过基于 GRPO-RoC 的高效代理强化学习实现最先进的数学推理
RStar2-Agent:通过基于 GRPO-RoC 的高效代理强化学 ...
Pref-GRPO:通过成对比较实现稳定文本图像生成强化学习的新方法
Pref-GRPO:通过成对比较实现稳定文本图像生成强化学习的新方法
TRACEALIGN:追踪大规模语言模型对齐漂移的原因和保护措施
TRACEALIGN:追踪大规模语言模型对齐漂移的原因和保护措施
AlignGuard-LoRA:一种结合了高效微调和安全保护的新正则化方法
AlignGuard-LoRA:一种结合了高效微调和安全保护的新正则化 ...
ChartCap:利用大型数据集和新的评估指标抑制图表标题幻觉
ChartCap:利用大型数据集和新的评估指标抑制图表标题幻觉
LAMIC:一种无需学习、布局可控的多参考图像生成方法
LAMIC:一种无需学习、布局可控的多参考图像生成方法
LiveMCPBench:在大型工具环境中评估 LLM 代理的新基准
LiveMCPBench:在大型工具环境中评估 LLM 代理的新基准
Goedel-Prover-V2:通过自我修正和逐步数据合成实现高效自动定理证明的新发展
Goedel-Prover-V2:通过自我修正和逐步数据合成实现高效自 ...
多人对话视频生成的新发展:麻省理工学院数据集和基线模型 "CovOG"
多人对话视频生成的新发展:麻省理工学院数据集和基线模型 "CovOG"
ToolTrain:利用 LLM 进行资源库深度搜索和问题定位的新方法
ToolTrain:利用 LLM 进行资源库深度搜索和问题定位的新方法
启用 FlashAttention 的令牌压缩 "表象移动 "的工作原理和效果
启用 FlashAttention 的令牌压缩 "表象移动 "的工作原 ...
CRINN:通过强化学习自动优化近似近邻算法
CRINN:通过强化学习自动优化近似近邻算法
CompassVerifier:彻底改变 LLM 解决方案验证的新基准和稳健模型
CompassVerifier:彻底改变 LLM 解决方案验证的新基准 ...
LongVie:通过多模式控制实现一分钟超高质量视频生成的新时代
LongVie:通过多模式控制实现一分钟超高质量视频生成的新时代
Skywork UniPic:新一代多模态模型,集图像理解、生成和编辑于一体,效率极高
Skywork UniPic:新一代多模态模型,集图像理解、生成和编辑 ...
种子扩散预览:兼具快速推理和高性能的下一代代码生成模型
种子扩散预览:兼具快速推理和高性能的下一代代码生成模型
MATE:多代理无障碍模式转换框架
MATE:多代理无障碍模式转换框架
小波扩散:最快的扩散模型
小波扩散:最快的扩散模型
生成图像
利用 ChatGPT 提高面部识别的准确性和透明度,这是软性生物识别技术的新发展
利用 ChatGPT 提高面部识别的准确性和透明度,这是软性生物识别技 ...
大型语言模型
[RL-GPT]在 Mincraft 中以比平常快几倍的速度获取钻石的框架现已推出
[RL-GPT]在 Mincraft 中以比平常快几倍的速度获取钻石的 ...
机器学习
现在有了一个框架,可以让法律硕士使用 MBTI 评估人的个性!
现在有了一个框架,可以让法律硕士使用 MBTI 评估人的个性!
聊天室GPT
[DPO]一种不使用强化学习,直接将大规模语言模型与用户偏好相匹配的方法
[DPO]一种不使用强化学习,直接将大规模语言模型与用户偏好相匹配的方 ...
RLHF
[Qwen2.5-Coder]专门从事代码生成、完成和数学推理任务的 LLM
[Qwen2.5-Coder]专门从事代码生成、完成和数学推理任务的 ...
大型语言模型
NeurIPS2020 Highlights
NeurIPS2020 Highlights
调查
简单!准确度高!异常检测模型PatchCore的吸引力
简单!准确度高!异常检测模型PatchCore的吸引力
目标检测
GAIA:新基准揭示了大规模语言模型的局限性
GAIA:新基准揭示了大规模语言模型的局限性
大型语言模型
人工智能艺术与人类艺术--人们更喜欢哪一种?
人工智能艺术与人类艺术--人们更喜欢哪一种?
生成图像
Swin 变形金刚] 基于变形金刚的图像识别模型,你现在要抓紧了
Swin 变形金刚] 基于变形金刚的图像识别模型,你现在要抓紧了
图片识别
U-Net和Transformer相结合!介绍Swin Unet,一个用于医学图像分割的新网络。
U-Net和Transformer相结合!介绍Swin Unet,一个 ...
医疗
最新的激活函数综合评述!
最新的激活函数综合评述!
调查