自然语言处理
对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法
对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法
RoboTwin 2.0:双臂操作机器人的可扩展合成数据生成和基准设计
RoboTwin 2.0:双臂操作机器人的可扩展合成数据生成和基准设计
通过基于属性的测试增强 LLM 代码生成!打破自欺欺人的新框架 PGS
通过基于属性的测试增强 LLM 代码生成!打破自欺欺人的新框架 PGS
OctoThinker 通过改进 Llama 来支持强化学习,展示了中间学习的威力
OctoThinker 通过改进 Llama 来支持强化学习,展示了中 ...
针对大规模语言模型的离群值安全预训练创新,可防止离群值并保护量化准确性
针对大规模语言模型的离群值安全预训练创新,可防止离群值并保护量化准确性
SwarmAgentic:利用蜂群智能全自动生成代理系统
SwarmAgentic:利用蜂群智能全自动生成代理系统
为了让人工智能不会忘记图像,CoMemo 率先推出了下一代视觉和语言模型
为了让人工智能不会忘记图像,CoMemo 率先推出了下一代视觉和语言模 ...
通过 "截断近端策略优化 "加速强化学习,实现长句生成的效率革命
通过 "截断近端策略优化 "加速强化学习,实现长句生成的效率革命
SCIVER 的未来:多模式科学索赔验证的前沿
SCIVER 的未来:多模式科学索赔验证的前沿
使用 PrefBERT 进行以语义为重点的奖励设计,这是一种用于生成长句的新评估方法
使用 PrefBERT 进行以语义为重点的奖励设计,这是一种用于生成长 ...
ProtoReasoning:通过逻辑和规划磨练通用推理技能
ProtoReasoning:通过逻辑和规划磨练通用推理技能
建议采用混合优先优化方法,彻底改变多模态 LLM 的推理性能!
建议采用混合优先优化方法,彻底改变多模态 LLM 的推理性能!
UnifiedCrawl:低资源语言数据收集和高效 LLM 适应的新方法
UnifiedCrawl:低资源语言数据收集和高效 LLM 适应的新方 ...
其他
OpenScholar:通过 LLM 实现科学文献的知识合成和可靠性提升
OpenScholar:通过 LLM 实现科学文献的知识合成和可靠性提 ...
让 LLM 代替人类当导师?用自然语言训练的强化学习代理
让 LLM 代替人类当导师?用自然语言训练的强化学习代理
超解析内存网络:改变 Transformer 内存效率的新方法
超解析内存网络:改变 Transformer 内存效率的新方法