大型语言模型
种子扩散预览:兼具快速推理和高性能的下一代代码生成模型
种子扩散预览:兼具快速推理和高性能的下一代代码生成模型
MATE:多代理无障碍模式转换框架
MATE:多代理无障碍模式转换框架
Biomed-Enriched:具有 LLM 注释的大型生物医学数据集,具有临床和教育价值
Biomed-Enriched:具有 LLM 注释的大型生物医学数据集 ...
调试 LLM 多少次有效?用于检测效果衰减的新指标 "DDI "是什么?
调试 LLM 多少次有效?用于检测效果衰减的新指标 "DDI "是什么 ...
速度与准确性的结合:量化感知 LLM 预训练 "QAP"。
速度与准确性的结合:量化感知 LLM 预训练 "QAP"。
Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间的提示中遗忘信息
Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间 ...
对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法
对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法
RoboTwin 2.0:双臂操作机器人的可扩展合成数据生成和基准设计
RoboTwin 2.0:双臂操作机器人的可扩展合成数据生成和基准设计
通过基于属性的测试增强 LLM 代码生成!打破自欺欺人的新框架 PGS
通过基于属性的测试增强 LLM 代码生成!打破自欺欺人的新框架 PGS
OctoThinker 通过改进 Llama 来支持强化学习,展示了中间学习的威力
OctoThinker 通过改进 Llama 来支持强化学习,展示了中 ...
什么是 DualTHOR?用于提高双臂机器人实际适应能力的新一代模拟器
什么是 DualTHOR?用于提高双臂机器人实际适应能力的新一代模拟器
针对大规模语言模型的离群值安全预训练创新,可防止离群值并保护量化准确性
针对大规模语言模型的离群值安全预训练创新,可防止离群值并保护量化准确性
FedNano:大型多模态模型的轻量级高效分布式学习
FedNano:大型多模态模型的轻量级高效分布式学习
SwarmAgentic:利用蜂群智能全自动生成代理系统
SwarmAgentic:利用蜂群智能全自动生成代理系统
为了让人工智能不会忘记图像,CoMemo 率先推出了下一代视觉和语言模型
为了让人工智能不会忘记图像,CoMemo 率先推出了下一代视觉和语言模 ...
通过 "截断近端策略优化 "加速强化学习,实现长句生成的效率革命
通过 "截断近端策略优化 "加速强化学习,实现长句生成的效率革命