自然语言处理
超解析内存网络:改变 Transformer 内存效率的新方法
超解析内存网络:改变 Transformer 内存效率的新方法
Hymba,一种挑战小型 LLM 极限的新架构
Hymba,一种挑战小型 LLM 极限的新架构
Insight-V:连接视觉与思维的多模态推理新策略
Insight-V:连接视觉与思维的多模态推理新策略
建立并分析 "TruthEval "数据集,揭示 LLM 的弱点
建立并分析 "TruthEval "数据集,揭示 LLM 的弱点
大型语言模型
SportQA 是一个新的数据集,用于测量大规模语言模型对体育运动的理解能力
SportQA 是一个新的数据集,用于测量大规模语言模型对体育运动的理 ...
大型语言模型
CLAP-IPA:通过语音和 IPA 序列的对比学习获得多语言语音表征
CLAP-IPA:通过语音和 IPA 序列的对比学习获得多语言语音表征
自然语言处理
大规模语言模型改变音乐教育的未来,Flute X GPT 和 LAUI 的潜力
大规模语言模型改变音乐教育的未来,Flute X GPT 和 LAUI ...
大型语言模型
跨层关注大大减少了变压器内存
跨层关注大大减少了变压器内存
Transformer
[RiceChem]用于评估 LLM 自动长式分级 (ALAG) 的数据集
[RiceChem]用于评估 LLM 自动长式分级 (ALAG) 的数 ...
大型语言模型
[Qwen2.5-Coder]专门从事代码生成、完成和数学推理任务的 LLM
[Qwen2.5-Coder]专门从事代码生成、完成和数学推理任务的 ...
大型语言模型
更好的注意机制提高了 LLM 长文本处理的性能!
更好的注意机制提高了 LLM 长文本处理的性能!
大型语言模型
Kolmogorov-Arnold 网络(KAN)代替 MLP,以提高模型的代表性和性能
Kolmogorov-Arnold 网络(KAN)代替 MLP,以提高 ...
大型语言模型
通过医疗保健专用的 LLM 提高诊断准确性,提供新的诊断支持
通过医疗保健专用的 LLM 提高诊断准确性,提供新的诊断支持
大型语言模型
[Chat-REC] 拟议的基于 LLM 的推荐系统
[Chat-REC] 拟议的基于 LLM 的推荐系统
建议
创建了一种自动评估 LLM 输出长句准确性的方法
创建了一种自动评估 LLM 输出长句准确性的方法
大型语言模型
[AlphaCodium] 性能最高的编程代码生成方法
[AlphaCodium] 性能最高的编程代码生成方法
大型语言模型
首个利用 LLM 检测假新闻的框架!
首个利用 LLM 检测假新闻的框架!
Fakenews