语言生成文章 | AI-SCHOLAR.TECH | AI-SCHOLAR | AI：（人工智能）文章和技术信息媒体

Skywork UniPic：新一代多模态模型，集图像理解、生成和编辑于一体，效率极高

Skywork UniPic：新一代多模态模型，集图像理解、生成和编辑 ...

13/08/2025

种子扩散预览：兼具快速推理和高性能的下一代代码生成模型

13/08/2025

Forget-Me-Not: 建议采用一种简单的提示技术，防止在长时间的提示中遗忘信息

Forget-Me-Not: 建议采用一种简单的提示技术，防止在长时间 ...

30/07/2025

使用 PrefBERT 进行以语义为重点的奖励设计，这是一种用于生成长句的新评估方法

使用 PrefBERT 进行以语义为重点的奖励设计，这是一种用于生成长 ...

05/07/2025

OpenScholar：通过 LLM 实现科学文献的知识合成和可靠性提升

[InfiMM-WebMath-40B]利用由 24 亿数学文档组成的数据集提高 LLM 的数学性能！

[InfiMM-WebMath-40B]利用由 24 亿数学文档组成的 ...

30/10/2024 数据集。

人工智能改变数学教育，使用大规模语言模型解决数学问题的潜力和挑战

16/10/2024 大型语言模型

[Qwen2.5-Coder]专门从事代码生成、完成和数学推理任务的 LLM

[Qwen2.5-Coder]专门从事代码生成、完成和数学推理任务的 ...

11/10/2024 大型语言模型

[NVLM]多模态 LLM 在图像和语言任务中的表现优于 GPT-4o

27/09/2024 大型语言模型

赶上最新的AI论文

语言生成

Skywork UniPic：新一代多模态模型，集图像理解、生成和编辑于一体，效率极高

Skywork UniPic：新一代多模态模型，集图像理解、生成和编辑 ...

种子扩散预览：兼具快速推理和高性能的下一代代码生成模型

种子扩散预览：兼具快速推理和高性能的下一代代码生成模型

Forget-Me-Not: 建议采用一种简单的提示技术，防止在长时间的提示中遗忘信息

Forget-Me-Not: 建议采用一种简单的提示技术，防止在长时间 ...

使用 PrefBERT 进行以语义为重点的奖励设计，这是一种用于生成长句的新评估方法

使用 PrefBERT 进行以语义为重点的奖励设计，这是一种用于生成长 ...

OpenScholar：通过 LLM 实现科学文献的知识合成和可靠性提升

OpenScholar：通过 LLM 实现科学文献的知识合成和可靠性提 ...

超解析内存网络：改变 Transformer 内存效率的新方法

超解析内存网络：改变 Transformer 内存效率的新方法

Hymba，一种挑战小型 LLM 极限的新架构

Hymba，一种挑战小型 LLM 极限的新架构

Insight-V：连接视觉与思维的多模态推理新策略

Insight-V：连接视觉与思维的多模态推理新策略

PosterLlama：语言模型设计能力和内容感知布局生成

PosterLlama：语言模型设计能力和内容感知布局生成

越南高中化学试题中大规模语言模型的局限性和可能性

越南高中化学试题中大规模语言模型的局限性和可能性

YesBut：帮助 VLM 理解讽刺和漫画的数据集的出现！

YesBut：帮助 VLM 理解讽刺和漫画的数据集的出现！

[InfiMM-WebMath-40B]利用由 24 亿数学文档组成的数据集提高 LLM 的数学性能！

[InfiMM-WebMath-40B]利用由 24 亿数学文档组成的 ...

人工智能改变数学教育，使用大规模语言模型解决数学问题的潜力和挑战

人工智能改变数学教育，使用大规模语言模型解决数学问题的潜力和挑战

[Qwen2.5-Coder]专门从事代码生成、完成和数学推理任务的 LLM

[Qwen2.5-Coder]专门从事代码生成、完成和数学推理任务的 ...

[NVLM]多模态 LLM 在图像和语言任务中的表现优于 GPT-4o

[NVLM]多模态 LLM 在图像和语言任务中的表现优于 GPT-4o

[beeFormer] Transformer 是通过在推荐系统中结合文本信息和交互数据训练出来的

[beeFormer] Transformer 是通过在推荐系统中结合 ...

[检索注意]提高 LLM 处理长上下文的效率！

[检索注意]提高 LLM 处理长上下文的效率！

[BitNet B1.58] 模型参数用三个值表示，精度优于 Llama！

[BitNet B1.58] 模型参数用三个值表示，精度优于 Llam ...