语言生成
种子扩散预览:兼具快速推理和高性能的下一代代码生成模型
种子扩散预览:兼具快速推理和高性能的下一代代码生成模型
Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间的提示中遗忘信息
Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间 ...
使用 PrefBERT 进行以语义为重点的奖励设计,这是一种用于生成长句的新评估方法
使用 PrefBERT 进行以语义为重点的奖励设计,这是一种用于生成长 ...
OpenScholar:通过 LLM 实现科学文献的知识合成和可靠性提升
OpenScholar:通过 LLM 实现科学文献的知识合成和可靠性提 ...
超解析内存网络:改变 Transformer 内存效率的新方法
超解析内存网络:改变 Transformer 内存效率的新方法
Hymba,一种挑战小型 LLM 极限的新架构
Hymba,一种挑战小型 LLM 极限的新架构
Insight-V:连接视觉与思维的多模态推理新策略
Insight-V:连接视觉与思维的多模态推理新策略
PosterLlama:语言模型设计能力和内容感知布局生成
PosterLlama:语言模型设计能力和内容感知布局生成
布局生成
越南高中化学试题中大规模语言模型的局限性和可能性
越南高中化学试题中大规模语言模型的局限性和可能性
大型语言模型
YesBut:帮助 VLM 理解讽刺和漫画的数据集的出现!
YesBut:帮助 VLM 理解讽刺和漫画的数据集的出现!
数据集
[InfiMM-WebMath-40B]利用由 24 亿数学文档组成的数据集提高 LLM 的数学性能!
[InfiMM-WebMath-40B]利用由 24 亿数学文档组成的 ...
数据集。
人工智能改变数学教育,使用大规模语言模型解决数学问题的潜力和挑战
人工智能改变数学教育,使用大规模语言模型解决数学问题的潜力和挑战
大型语言模型
[Qwen2.5-Coder]专门从事代码生成、完成和数学推理任务的 LLM
[Qwen2.5-Coder]专门从事代码生成、完成和数学推理任务的 ...
大型语言模型
[NVLM]多模态 LLM 在图像和语言任务中的表现优于 GPT-4o
[NVLM]多模态 LLM 在图像和语言任务中的表现优于 GPT-4o
大型语言模型
[beeFormer] Transformer 是通过在推荐系统中结合文本信息和交互数据训练出来的
[beeFormer] Transformer 是通过在推荐系统中结合 ...
大型语言模型
[检索注意]提高 LLM 处理长上下文的效率!
[检索注意]提高 LLM 处理长上下文的效率!
大型语言模型
[BitNet B1.58] 模型参数用三个值表示,精度优于 Llama!
[BitNet B1.58] 模型参数用三个值表示,精度优于 Llam ...
大型语言模型