Transformer
超解析内存网络:改变 Transformer 内存效率的新方法
超解析内存网络:改变 Transformer 内存效率的新方法
Hymba,一种挑战小型 LLM 极限的新架构
Hymba,一种挑战小型 LLM 极限的新架构
Insight-V:连接视觉与思维的多模态推理新策略
Insight-V:连接视觉与思维的多模态推理新策略
稳定流:图像生成背后 "真正重要的层次 "可视化
稳定流:图像生成背后 "真正重要的层次 "可视化
通过 OWL-ViT 实现开放词汇对象检测
通过 OWL-ViT 实现开放词汇对象检测
神经网络
一项极具挑战性的分类任务!使用 WHFEMD 算法准确、高效地捕捉和分类发音障碍的特征
一项极具挑战性的分类任务!使用 WHFEMD 算法准确、高效地捕捉和分 ...
肢体瘫痪者的语音识别功能
让法律硕士在白板上写下他们的推理过程,可以大大提高他们的视觉推理能力!
让法律硕士在白板上写下他们的推理过程,可以大大提高他们的视觉推理能力!
提示方法
跨层关注大大减少了变压器内存
跨层关注大大减少了变压器内存
Transformer
YesBut:帮助 VLM 理解讽刺和漫画的数据集的出现!
YesBut:帮助 VLM 理解讽刺和漫画的数据集的出现!
数据集
[SCoRe]强化学习,提高 LLM 自我纠错能力!在多步骤过程中发现和纠正错误
[SCoRe]强化学习,提高 LLM 自我纠错能力!在多步骤过程中发现 ...
大型语言模型
人工智能改变数学教育,使用大规模语言模型解决数学问题的潜力和挑战
人工智能改变数学教育,使用大规模语言模型解决数学问题的潜力和挑战
大型语言模型
更好的注意机制提高了 LLM 长文本处理的性能!
更好的注意机制提高了 LLM 长文本处理的性能!
大型语言模型
OmniGen] 只需一个生成模型就能完成所有基于图像的任务!
OmniGen] 只需一个生成模型就能完成所有基于图像的任务!
生成图像
SkySense:多模态遥感基础模型
SkySense:多模态遥感基础模型
CVPR
谷歌的高性能 LLM 可压缩超长提示语句以节省内存
谷歌的高性能 LLM 可压缩超长提示语句以节省内存
大型语言模型
GenTron:用于生成图像和视频的扩散变换器
GenTron:用于生成图像和视频的扩散变换器
生成图像
[BitNet] 用单个比特进行推理的大规模语言模型
[BitNet] 用单个比特进行推理的大规模语言模型
比特网