大型语言模型文章 | AI-SCHOLAR.TECH | AI-SCHOLAR | AI：（人工智能）文章和技术信息媒体

Skywork UniPic：新一代多模态模型，集图像理解、生成和编辑于一体，效率极高

Biomed-Enriched：具有 LLM 注释的大型生物医学数据集，具有临床和教育价值

Biomed-Enriched：具有 LLM 注释的大型生物医学数据集 ...

12/08/2025

调试 LLM 多少次有效？用于检测效果衰减的新指标 "DDI "是什么？

调试 LLM 多少次有效？用于检测效果衰减的新指标 "DDI "是什么 ...

06/08/2025

速度与准确性的结合：量化感知 LLM 预训练 "QAP"。

02/08/2025

Forget-Me-Not: 建议采用一种简单的提示技术，防止在长时间的提示中遗忘信息

Forget-Me-Not: 建议采用一种简单的提示技术，防止在长时间 ...

30/07/2025

对话优化标记器的潜力：一种将 LLM 推理效率提高 10% 的方法

30/07/2025

RoboTwin 2.0：双臂操作机器人的可扩展合成数据生成和基准设计

29/07/2025

通过基于属性的测试增强 LLM 代码生成！打破自欺欺人的新框架 PGS

29/07/2025

OctoThinker 通过改进 Llama 来支持强化学习，展示了中间学习的威力

OctoThinker 通过改进 Llama 来支持强化学习，展示了中 ...

28/07/2025

什么是 DualTHOR？用于提高双臂机器人实际适应能力的新一代模拟器

28/07/2025

针对大规模语言模型的离群值安全预训练创新，可防止离群值并保护量化准确性

26/07/2025

FedNano：大型多模态模型的轻量级高效分布式学习

24/07/2025

SwarmAgentic：利用蜂群智能全自动生成代理系统

23/07/2025

为了让人工智能不会忘记图像，CoMemo 率先推出了下一代视觉和语言模型

为了让人工智能不会忘记图像，CoMemo 率先推出了下一代视觉和语言模 ...

18/07/2025

通过 "截断近端策略优化 "加速强化学习，实现长句生成的效率革命

14/07/2025

使用 PrefBERT 进行以语义为重点的奖励设计，这是一种用于生成长句的新评估方法

使用 PrefBERT 进行以语义为重点的奖励设计，这是一种用于生成长 ...

05/07/2025

大型语言模型

Skywork UniPic：新一代多模态模型，集图像理解、生成和编辑于一体，效率极高

Skywork UniPic：新一代多模态模型，集图像理解、生成和编辑 ...

种子扩散预览：兼具快速推理和高性能的下一代代码生成模型

种子扩散预览：兼具快速推理和高性能的下一代代码生成模型

MATE：多代理无障碍模式转换框架

MATE：多代理无障碍模式转换框架

Biomed-Enriched：具有 LLM 注释的大型生物医学数据集，具有临床和教育价值

Biomed-Enriched：具有 LLM 注释的大型生物医学数据集 ...

调试 LLM 多少次有效？用于检测效果衰减的新指标 "DDI "是什么？

调试 LLM 多少次有效？用于检测效果衰减的新指标 "DDI "是什么 ...

速度与准确性的结合：量化感知 LLM 预训练 "QAP"。

速度与准确性的结合：量化感知 LLM 预训练 "QAP"。

Forget-Me-Not: 建议采用一种简单的提示技术，防止在长时间的提示中遗忘信息

Forget-Me-Not: 建议采用一种简单的提示技术，防止在长时间 ...

对话优化标记器的潜力：一种将 LLM 推理效率提高 10% 的方法

对话优化标记器的潜力：一种将 LLM 推理效率提高 10% 的方法

RoboTwin 2.0：双臂操作机器人的可扩展合成数据生成和基准设计

RoboTwin 2.0：双臂操作机器人的可扩展合成数据生成和基准设计

通过基于属性的测试增强 LLM 代码生成！打破自欺欺人的新框架 PGS

通过基于属性的测试增强 LLM 代码生成！打破自欺欺人的新框架 PGS

OctoThinker 通过改进 Llama 来支持强化学习，展示了中间学习的威力

OctoThinker 通过改进 Llama 来支持强化学习，展示了中 ...

什么是 DualTHOR？用于提高双臂机器人实际适应能力的新一代模拟器

什么是 DualTHOR？用于提高双臂机器人实际适应能力的新一代模拟器

针对大规模语言模型的离群值安全预训练创新，可防止离群值并保护量化准确性

针对大规模语言模型的离群值安全预训练创新，可防止离群值并保护量化准确性

FedNano：大型多模态模型的轻量级高效分布式学习

FedNano：大型多模态模型的轻量级高效分布式学习

SwarmAgentic：利用蜂群智能全自动生成代理系统

SwarmAgentic：利用蜂群智能全自动生成代理系统

为了让人工智能不会忘记图像，CoMemo 率先推出了下一代视觉和语言模型

为了让人工智能不会忘记图像，CoMemo 率先推出了下一代视觉和语言模 ...

通过 "截断近端策略优化 "加速强化学习，实现长句生成的效率革命

通过 "截断近端策略优化 "加速强化学习，实现长句生成的效率革命

使用 PrefBERT 进行以语义为重点的奖励设计，这是一种用于生成长句的新评估方法

使用 PrefBERT 进行以语义为重点的奖励设计，这是一种用于生成长 ...