语言生成
OpenScholar:通过 LLM 实现科学文献的知识合成和可靠性提升
OpenScholar:通过 LLM 实现科学文献的知识合成和可靠性提 ...
超解析内存网络:改变 Transformer 内存效率的新方法
超解析内存网络:改变 Transformer 内存效率的新方法
Hymba,一种挑战小型 LLM 极限的新架构
Hymba,一种挑战小型 LLM 极限的新架构
Insight-V:连接视觉与思维的多模态推理新策略
Insight-V:连接视觉与思维的多模态推理新策略
PosterLlama:语言模型设计能力和内容感知布局生成
PosterLlama:语言模型设计能力和内容感知布局生成
布局生成
越南高中化学试题中大规模语言模型的局限性和可能性
越南高中化学试题中大规模语言模型的局限性和可能性
大型语言模型
YesBut:帮助 VLM 理解讽刺和漫画的数据集的出现!
YesBut:帮助 VLM 理解讽刺和漫画的数据集的出现!
数据集
[InfiMM-WebMath-40B]利用由 24 亿数学文档组成的数据集提高 LLM 的数学性能!
[InfiMM-WebMath-40B]利用由 24 亿数学文档组成的 ...
数据集。
人工智能改变数学教育,使用大规模语言模型解决数学问题的潜力和挑战
人工智能改变数学教育,使用大规模语言模型解决数学问题的潜力和挑战
大型语言模型
[Qwen2.5-Coder]专门从事代码生成、完成和数学推理任务的 LLM
[Qwen2.5-Coder]专门从事代码生成、完成和数学推理任务的 ...
大型语言模型
[NVLM]多模态 LLM 在图像和语言任务中的表现优于 GPT-4o
[NVLM]多模态 LLM 在图像和语言任务中的表现优于 GPT-4o
大型语言模型
[beeFormer] Transformer 是通过在推荐系统中结合文本信息和交互数据训练出来的
[beeFormer] Transformer 是通过在推荐系统中结合 ...
大型语言模型
[检索注意]提高 LLM 处理长上下文的效率!
[检索注意]提高 LLM 处理长上下文的效率!
大型语言模型
[BitNet B1.58] 模型参数用三个值表示,精度优于 Llama!
[BitNet B1.58] 模型参数用三个值表示,精度优于 Llam ...
大型语言模型
[Mustango] 使用音乐领域知识的音乐生成模型
[Mustango] 使用音乐领域知识的音乐生成模型
音频和语音处理
[VoiceCraft] 业界最高水平的自然语音合成语言模型
[VoiceCraft] 业界最高水平的自然语音合成语言模型
文字转语音
创建了一种自动评估 LLM 输出长句准确性的方法
创建了一种自动评估 LLM 输出长句准确性的方法
大型语言模型