语言处理
SwarmAgentic:利用蜂群智能全自动生成代理系统
SwarmAgentic:利用蜂群智能全自动生成代理系统
为了让人工智能不会忘记图像,CoMemo 率先推出了下一代视觉和语言模型
为了让人工智能不会忘记图像,CoMemo 率先推出了下一代视觉和语言模 ...
通过 "截断近端策略优化 "加速强化学习,实现长句生成的效率革命
通过 "截断近端策略优化 "加速强化学习,实现长句生成的效率革命
UnifiedCrawl:低资源语言数据收集和高效 LLM 适应的新方法
UnifiedCrawl:低资源语言数据收集和高效 LLM 适应的新方 ...
其他
超解析内存网络:改变 Transformer 内存效率的新方法
超解析内存网络:改变 Transformer 内存效率的新方法
Hymba,一种挑战小型 LLM 极限的新架构
Hymba,一种挑战小型 LLM 极限的新架构
Insight-V:连接视觉与思维的多模态推理新策略
Insight-V:连接视觉与思维的多模态推理新策略
建立并分析 "TruthEval "数据集,揭示 LLM 的弱点
建立并分析 "TruthEval "数据集,揭示 LLM 的弱点
大型语言模型
SportQA 是一个新的数据集,用于测量大规模语言模型对体育运动的理解能力
SportQA 是一个新的数据集,用于测量大规模语言模型对体育运动的理 ...
大型语言模型
CLAP-IPA:通过语音和 IPA 序列的对比学习获得多语言语音表征
CLAP-IPA:通过语音和 IPA 序列的对比学习获得多语言语音表征
自然语言处理
大规模语言模型改变音乐教育的未来,Flute X GPT 和 LAUI 的潜力
大规模语言模型改变音乐教育的未来,Flute X GPT 和 LAUI ...
大型语言模型
科学文章中 ChatGPT 的使用和影响,Binoculars 的分析
科学文章中 ChatGPT 的使用和影响,Binoculars 的分析
大型语言模型
用于量化法律硕士社会偏见的评估指标现已出台!
用于量化法律硕士社会偏见的评估指标现已出台!
社会偏见。
跨层关注大大减少了变压器内存
跨层关注大大减少了变压器内存
Transformer
[SCoRe]强化学习,提高 LLM 自我纠错能力!在多步骤过程中发现和纠正错误
[SCoRe]强化学习,提高 LLM 自我纠错能力!在多步骤过程中发现 ...
大型语言模型
[InfiMM-WebMath-40B]利用由 24 亿数学文档组成的数据集提高 LLM 的数学性能!
[InfiMM-WebMath-40B]利用由 24 亿数学文档组成的 ...
数据集。
现在,基于 BERT 的模型可用于预测具有遗传信息的 MRNA 的功能!
现在,基于 BERT 的模型可用于预测具有遗传信息的 MRNA 的功能 ...
大型语言模型