论文
GPT-4o 级图像生成的民主化:Janus-4o 和 ShareGPT-4o-Image 挑战
GPT-4o 级图像生成的民主化:Janus-4o 和 ShareGP ...
FedNano:大型多模态模型的轻量级高效分布式学习
FedNano:大型多模态模型的轻量级高效分布式学习
ImmerseGen:由代理引导的、轻量级的、高度逼真的下一代虚拟现实场景生成
ImmerseGen:由代理引导的、轻量级的、高度逼真的下一代虚拟现实 ...
SwarmAgentic:利用蜂群智能全自动生成代理系统
SwarmAgentic:利用蜂群智能全自动生成代理系统
为了让人工智能不会忘记图像,CoMemo 率先推出了下一代视觉和语言模型
为了让人工智能不会忘记图像,CoMemo 率先推出了下一代视觉和语言模 ...
PictSure:通过视觉嵌入功能挑战 "Few-Shot "分类的新方法
PictSure:通过视觉嵌入功能挑战 "Few-Shot "分类的新 ...
通过 "截断近端策略优化 "加速强化学习,实现长句生成的效率革命
通过 "截断近端策略优化 "加速强化学习,实现长句生成的效率革命
SCIVER 的未来:多模式科学索赔验证的前沿
SCIVER 的未来:多模式科学索赔验证的前沿
使用 PrefBERT 进行以语义为重点的奖励设计,这是一种用于生成长句的新评估方法
使用 PrefBERT 进行以语义为重点的奖励设计,这是一种用于生成长 ...
嵌入式网络代理 "的挑战,新一代人工智能将物理与数字相结合
嵌入式网络代理 "的挑战,新一代人工智能将物理与数字相结合
多扬声器语音识别的新浪潮:使用 DiCoW 和 DiariZen 的高精度系统的挑战
多扬声器语音识别的新浪潮:使用 DiCoW 和 DiariZen 的高 ...
GenRecal,一个用于轻量级高性能的通用蒸馏框架
GenRecal,一个用于轻量级高性能的通用蒸馏框架
ProtoReasoning:通过逻辑和规划磨练通用推理技能
ProtoReasoning:通过逻辑和规划磨练通用推理技能
建议采用混合优先优化方法,彻底改变多模态 LLM 的推理性能!
建议采用混合优先优化方法,彻底改变多模态 LLM 的推理性能!
UnifiedCrawl:低资源语言数据收集和高效 LLM 适应的新方法
UnifiedCrawl:低资源语言数据收集和高效 LLM 适应的新方 ...
其他
OpenScholar:通过 LLM 实现科学文献的知识合成和可靠性提升
OpenScholar:通过 LLM 实现科学文献的知识合成和可靠性提 ...