生成模型
对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法
对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法
RoboTwin 2.0:双臂操作机器人的可扩展合成数据生成和基准设计
RoboTwin 2.0:双臂操作机器人的可扩展合成数据生成和基准设计
通过基于属性的测试增强 LLM 代码生成!打破自欺欺人的新框架 PGS
通过基于属性的测试增强 LLM 代码生成!打破自欺欺人的新框架 PGS
OctoThinker 通过改进 Llama 来支持强化学习,展示了中间学习的威力
OctoThinker 通过改进 Llama 来支持强化学习,展示了中 ...
GPT-4o 级图像生成的民主化:Janus-4o 和 ShareGPT-4o-Image 挑战
GPT-4o 级图像生成的民主化:Janus-4o 和 ShareGP ...
FedNano:大型多模态模型的轻量级高效分布式学习
FedNano:大型多模态模型的轻量级高效分布式学习
ImmerseGen:由代理引导的、轻量级的、高度逼真的下一代虚拟现实场景生成
ImmerseGen:由代理引导的、轻量级的、高度逼真的下一代虚拟现实 ...
PictSure:通过视觉嵌入功能挑战 "Few-Shot "分类的新方法
PictSure:通过视觉嵌入功能挑战 "Few-Shot "分类的新 ...
使用 PrefBERT 进行以语义为重点的奖励设计,这是一种用于生成长句的新评估方法
使用 PrefBERT 进行以语义为重点的奖励设计,这是一种用于生成长 ...
Insight-V:连接视觉与思维的多模态推理新策略
Insight-V:连接视觉与思维的多模态推理新策略
稳定流:图像生成背后 "真正重要的层次 "可视化
稳定流:图像生成背后 "真正重要的层次 "可视化
建立并分析 "TruthEval "数据集,揭示 LLM 的弱点
建立并分析 "TruthEval "数据集,揭示 LLM 的弱点
大型语言模型
MaskDiT:用于图像生成的低学习成本扩散模型
MaskDiT:用于图像生成的低学习成本扩散模型
生成图像
越南高中化学试题中大规模语言模型的局限性和可能性
越南高中化学试题中大规模语言模型的局限性和可能性
大型语言模型
让法律硕士在白板上写下他们的推理过程,可以大大提高他们的视觉推理能力!
让法律硕士在白板上写下他们的推理过程,可以大大提高他们的视觉推理能力!
提示方法
MicroDiffusion:千元生成图像质量模型,胜过数万美元的模型
MicroDiffusion:千元生成图像质量模型,胜过数万美元的模型
生成图像
科学文章中 ChatGPT 的使用和影响,Binoculars 的分析
科学文章中 ChatGPT 的使用和影响,Binoculars 的分析
大型语言模型