新的AI文章列表
启用 FlashAttention 的令牌压缩 "表象移动 "的工作原理和效果
启用 FlashAttention 的令牌压缩 "表象移动 "的工作原 ...
CRINN:通过强化学习自动优化近似近邻算法
CRINN:通过强化学习自动优化近似近邻算法
CompassVerifier:彻底改变 LLM 解决方案验证的新基准和稳健模型
CompassVerifier:彻底改变 LLM 解决方案验证的新基准 ...
LongVie:通过多模式控制实现一分钟超高质量视频生成的新时代
LongVie:通过多模式控制实现一分钟超高质量视频生成的新时代
Skywork UniPic:新一代多模态模型,集图像理解、生成和编辑于一体,效率极高
Skywork UniPic:新一代多模态模型,集图像理解、生成和编辑 ...
种子扩散预览:兼具快速推理和高性能的下一代代码生成模型
种子扩散预览:兼具快速推理和高性能的下一代代码生成模型
MATE:多代理无障碍模式转换框架
MATE:多代理无障碍模式转换框架
Biomed-Enriched:具有 LLM 注释的大型生物医学数据集,具有临床和教育价值
Biomed-Enriched:具有 LLM 注释的大型生物医学数据集 ...
调试 LLM 多少次有效?用于检测效果衰减的新指标 "DDI "是什么?
调试 LLM 多少次有效?用于检测效果衰减的新指标 "DDI "是什么 ...
速度与准确性的结合:量化感知 LLM 预训练 "QAP"。
速度与准确性的结合:量化感知 LLM 预训练 "QAP"。
HiWave:无需额外学习即可生成 4K 图像的小波扩散创新
HiWave:无需额外学习即可生成 4K 图像的小波扩散创新
Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间的提示中遗忘信息
Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间 ...
对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法
对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法
RoboTwin 2.0:双臂操作机器人的可扩展合成数据生成和基准设计
RoboTwin 2.0:双臂操作机器人的可扩展合成数据生成和基准设计
通过基于属性的测试增强 LLM 代码生成!打破自欺欺人的新框架 PGS
通过基于属性的测试增强 LLM 代码生成!打破自欺欺人的新框架 PGS
OctoThinker 通过改进 Llama 来支持强化学习,展示了中间学习的威力
OctoThinker 通过改进 Llama 来支持强化学习,展示了中 ...