Hymba,一种挑战小型 LLM 极限的新架构
Hymba,一种挑战小型 LLM 极限的新架构
利用仓本模型在非欧几里得空间进行机器学习
利用仓本模型在非欧几里得空间进行机器学习
计算机视觉
[MGSER-SAM]解决连续学习中灾难性遗忘问题的方法
[MGSER-SAM]解决连续学习中灾难性遗忘问题的方法
持续学习
物联网设备:分配推理负载的联合学习方法
物联网设备:分配推理负载的联合学习方法
物联网
ADAMG,深度学习优化的一场革命:无参数优化的新时代
ADAMG,深度学习优化的一场革命:无参数优化的新时代
大型语言模型
在大规模采用电动汽车的时代,人工智能将解决电力供需难题
在大规模采用电动汽车的时代,人工智能将解决电力供需难题
神经网络
[FlagVNE] 用于虚拟网络嵌入的灵活、可通用的强化学习框架
[FlagVNE] 用于虚拟网络嵌入的灵活、可通用的强化学习框架
网络和互联网架构
[双重后裔] 为什么 "大模型 "和 "大数据集 "很重要?
[双重后裔] 为什么 "大模型 "和 "大数据集 "很重要?
神经网络
减少销售损失的关键:利用高速代理辅助 MCTS 优化企业设施网络
减少销售损失的关键:利用高速代理辅助 MCTS 优化企业设施网络
Meta 为贝叶斯优化带来意想不到的改进
Meta 为贝叶斯优化带来意想不到的改进
贝叶斯优化
Teach Augment:通过使用教师模型来优化数据的扩充。
Teach Augment:通过使用教师模型来优化数据的扩充。
数据增强