[InfiMM-WebMath-40B]利用由 24 亿数学文档组成的数据集提高 LLM 的数学性能! [InfiMM-WebMath-40B]利用由 24 亿数学文档组成的 ... 30/10/2024 数据集。
[Ferret] 一种简化分布式 LLM 环境中所有参数调整的方法!显著降低通信成本,提高模型精度 [Ferret] 一种简化分布式 LLM 环境中所有参数调整的方法!显 ... 26/09/2024 大型语言模型
[beeFormer] Transformer 是通过在推荐系统中结合文本信息和交互数据训练出来的 [beeFormer] Transformer 是通过在推荐系统中结合 ... 25/09/2024 大型语言模型