生成模型
种子扩散预览:兼具快速推理和高性能的下一代代码生成模型
种子扩散预览:兼具快速推理和高性能的下一代代码生成模型
速度与准确性的结合:量化感知 LLM 预训练 "QAP"。
速度与准确性的结合:量化感知 LLM 预训练 "QAP"。
Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间的提示中遗忘信息
Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间 ...
对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法
对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法
RoboTwin 2.0:双臂操作机器人的可扩展合成数据生成和基准设计
RoboTwin 2.0:双臂操作机器人的可扩展合成数据生成和基准设计
通过基于属性的测试增强 LLM 代码生成!打破自欺欺人的新框架 PGS
通过基于属性的测试增强 LLM 代码生成!打破自欺欺人的新框架 PGS
OctoThinker 通过改进 Llama 来支持强化学习,展示了中间学习的威力
OctoThinker 通过改进 Llama 来支持强化学习,展示了中 ...
GPT-4o 级图像生成的民主化:Janus-4o 和 ShareGPT-4o-Image 挑战
GPT-4o 级图像生成的民主化:Janus-4o 和 ShareGP ...
FedNano:大型多模态模型的轻量级高效分布式学习
FedNano:大型多模态模型的轻量级高效分布式学习
ImmerseGen:由代理引导的、轻量级的、高度逼真的下一代虚拟现实场景生成
ImmerseGen:由代理引导的、轻量级的、高度逼真的下一代虚拟现实 ...
PictSure:通过视觉嵌入功能挑战 "Few-Shot "分类的新方法
PictSure:通过视觉嵌入功能挑战 "Few-Shot "分类的新 ...
使用 PrefBERT 进行以语义为重点的奖励设计,这是一种用于生成长句的新评估方法
使用 PrefBERT 进行以语义为重点的奖励设计,这是一种用于生成长 ...
Insight-V:连接视觉与思维的多模态推理新策略
Insight-V:连接视觉与思维的多模态推理新策略
稳定流:图像生成背后 "真正重要的层次 "可视化
稳定流:图像生成背后 "真正重要的层次 "可视化
建立并分析 "TruthEval "数据集,揭示 LLM 的弱点
建立并分析 "TruthEval "数据集,揭示 LLM 的弱点
大型语言模型
MaskDiT:用于图像生成的低学习成本扩散模型
MaskDiT:用于图像生成的低学习成本扩散模型
生成图像
越南高中化学试题中大规模语言模型的局限性和可能性
越南高中化学试题中大规模语言模型的局限性和可能性
大型语言模型