文章
AWORLD:通过分布式框架实现代理人工智能的高效学习平台
AWORLD:通过分布式框架实现代理人工智能的高效学习平台
由 MCP-Bench 首创的 LLM 代理评估新趋势!复杂任务和真实世界场景的挑战
由 MCP-Bench 首创的 LLM 代理评估新趋势!复杂任务和真实 ...
USO",一种基于分离和奖励学习的新方法:走在将风格和主题融为一体的图像生成的最前沿
USO",一种基于分离和奖励学习的新方法:走在将风格和主题融为一体的图 ...
RStar2-Agent:通过基于 GRPO-RoC 的高效代理强化学习实现最先进的数学推理
RStar2-Agent:通过基于 GRPO-RoC 的高效代理强化学 ...
Pref-GRPO:通过成对比较实现稳定文本图像生成强化学习的新方法
Pref-GRPO:通过成对比较实现稳定文本图像生成强化学习的新方法
TRACEALIGN:追踪大规模语言模型对齐漂移的原因和保护措施
TRACEALIGN:追踪大规模语言模型对齐漂移的原因和保护措施
AlignGuard-LoRA:一种结合了高效微调和安全保护的新正则化方法
AlignGuard-LoRA:一种结合了高效微调和安全保护的新正则化 ...
ChartCap:利用大型数据集和新的评估指标抑制图表标题幻觉
ChartCap:利用大型数据集和新的评估指标抑制图表标题幻觉
LAMIC:一种无需学习、布局可控的多参考图像生成方法
LAMIC:一种无需学习、布局可控的多参考图像生成方法
LiveMCPBench:在大型工具环境中评估 LLM 代理的新基准
LiveMCPBench:在大型工具环境中评估 LLM 代理的新基准
Goedel-Prover-V2:通过自我修正和逐步数据合成实现高效自动定理证明的新发展
Goedel-Prover-V2:通过自我修正和逐步数据合成实现高效自 ...
多人对话视频生成的新发展:麻省理工学院数据集和基线模型 "CovOG"
多人对话视频生成的新发展:麻省理工学院数据集和基线模型 "CovOG"
ToolTrain:利用 LLM 进行资源库深度搜索和问题定位的新方法
ToolTrain:利用 LLM 进行资源库深度搜索和问题定位的新方法
启用 FlashAttention 的令牌压缩 "表象移动 "的工作原理和效果
启用 FlashAttention 的令牌压缩 "表象移动 "的工作原 ...
CRINN:通过强化学习自动优化近似近邻算法
CRINN:通过强化学习自动优化近似近邻算法
CompassVerifier:彻底改变 LLM 解决方案验证的新基准和稳健模型
CompassVerifier:彻底改变 LLM 解决方案验证的新基准 ...
LongVie:通过多模式控制实现一分钟超高质量视频生成的新时代
LongVie:通过多模式控制实现一分钟超高质量视频生成的新时代
小波扩散:最快的扩散模型
小波扩散:最快的扩散模型
生成图像
利用 ChatGPT 提高面部识别的准确性和透明度,这是软性生物识别技术的新发展
利用 ChatGPT 提高面部识别的准确性和透明度,这是软性生物识别技 ...
大型语言模型
[RL-GPT]在 Mincraft 中以比平常快几倍的速度获取钻石的框架现已推出
[RL-GPT]在 Mincraft 中以比平常快几倍的速度获取钻石的 ...
机器学习
现在有了一个框架,可以让法律硕士使用 MBTI 评估人的个性!
现在有了一个框架,可以让法律硕士使用 MBTI 评估人的个性!
聊天室GPT
掩码 R-CNN:高效检测图像中的物体
掩码 R-CNN:高效检测图像中的物体
计算机视觉
种子扩散预览:兼具快速推理和高性能的下一代代码生成模型
种子扩散预览:兼具快速推理和高性能的下一代代码生成模型
首个利用 LLM 检测假新闻的框架!
首个利用 LLM 检测假新闻的框架!
Fakenews
图形是如此的神奇!审查与深度学习的整合
图形是如此的神奇!审查与深度学习的整合
GNN
GPT-4o 级图像生成的民主化:Janus-4o 和 ShareGPT-4o-Image 挑战
GPT-4o 级图像生成的民主化:Janus-4o 和 ShareGP ...
在 35% 的情况下,LLM 代理都能成功引导客户购买!
在 35% 的情况下,LLM 代理都能成功引导客户购买!
聊天室GPT
优于ViT!大规模CNN的新基本模型!:InternImage
优于ViT!大规模CNN的新基本模型!:InternImage
深度学习
[DPO]一种不使用强化学习,直接将大规模语言模型与用户偏好相匹配的方法
[DPO]一种不使用强化学习,直接将大规模语言模型与用户偏好相匹配的方 ...
RLHF
简单!准确度高!异常检测模型PatchCore的吸引力
简单!准确度高!异常检测模型PatchCore的吸引力
目标检测