深度学习
针对大规模语言模型的离群值安全预训练创新,可防止离群值并保护量化准确性
针对大规模语言模型的离群值安全预训练创新,可防止离群值并保护量化准确性
FedNano:大型多模态模型的轻量级高效分布式学习
FedNano:大型多模态模型的轻量级高效分布式学习
SwarmAgentic:利用蜂群智能全自动生成代理系统
SwarmAgentic:利用蜂群智能全自动生成代理系统
为了让人工智能不会忘记图像,CoMemo 率先推出了下一代视觉和语言模型
为了让人工智能不会忘记图像,CoMemo 率先推出了下一代视觉和语言模 ...
PictSure:通过视觉嵌入功能挑战 "Few-Shot "分类的新方法
PictSure:通过视觉嵌入功能挑战 "Few-Shot "分类的新 ...
通过 "截断近端策略优化 "加速强化学习,实现长句生成的效率革命
通过 "截断近端策略优化 "加速强化学习,实现长句生成的效率革命
SCIVER 的未来:多模式科学索赔验证的前沿
SCIVER 的未来:多模式科学索赔验证的前沿
使用 PrefBERT 进行以语义为重点的奖励设计,这是一种用于生成长句的新评估方法
使用 PrefBERT 进行以语义为重点的奖励设计,这是一种用于生成长 ...
嵌入式网络代理 "的挑战,新一代人工智能将物理与数字相结合
嵌入式网络代理 "的挑战,新一代人工智能将物理与数字相结合
多扬声器语音识别的新浪潮:使用 DiCoW 和 DiariZen 的高精度系统的挑战
多扬声器语音识别的新浪潮:使用 DiCoW 和 DiariZen 的高 ...
GenRecal,一个用于轻量级高性能的通用蒸馏框架
GenRecal,一个用于轻量级高性能的通用蒸馏框架
ProtoReasoning:通过逻辑和规划磨练通用推理技能
ProtoReasoning:通过逻辑和规划磨练通用推理技能
建议采用混合优先优化方法,彻底改变多模态 LLM 的推理性能!
建议采用混合优先优化方法,彻底改变多模态 LLM 的推理性能!
UnifiedCrawl:低资源语言数据收集和高效 LLM 适应的新方法
UnifiedCrawl:低资源语言数据收集和高效 LLM 适应的新方 ...
其他
让 LLM 代替人类当导师?用自然语言训练的强化学习代理
让 LLM 代替人类当导师?用自然语言训练的强化学习代理
超解析内存网络:改变 Transformer 内存效率的新方法
超解析内存网络:改变 Transformer 内存效率的新方法