模型压缩文章 | AI-SCHOLAR.TECH | AI-SCHOLAR | AI：（人工智能）文章和技术信息媒体

[BitNet B1.58] 模型参数用三个值表示，精度优于 Llama！

[BitNet B1.58] 模型参数用三个值表示，精度优于 Llam ...

27/08/2024 大型语言模型

苹果公司在内存容量有限的设备上实现高效的大规模语言模型推理

29/01/2024 大型语言模型

I-ViT：以整数类型计算 ViT！此外，还提供由 I-BERT 技术发展而来的 Shiftmax 和 ShiftGELU！

I-ViT：以整数类型计算 ViT！此外，还提供由 I-BERT 技术 ...

16/11/2023 Transformer

ImageNet预学习模型的修剪在下游任务中是如何进行的？

09/09/2022 剪枝

在物联网设备上运行的神经网路的架构探索方法。

31/08/2022 纳斯达克

无条件的GANs的模型压缩

19/11/2021 生成对抗网络(GAN)

"LayerDrop "提议；Dropout层，而不是权重或节点！

12/03/2021 辍学

手机上实行GAN! 结合压缩技术减重，"GAN瘦身"

18/09/2020 生成对抗网络(GAN)

BERT For The Poor：用简单的技术降低复杂模型的权重，用有限的资源实现性能最大化的技术!

BERT For The Poor：用简单的技术降低复杂模型的权重，用 ...

23/05/2020 剪枝

模型压缩

速度与准确性的结合：量化感知 LLM 预训练 "QAP"。

速度与准确性的结合：量化感知 LLM 预训练 "QAP"。

针对大规模语言模型的离群值安全预训练创新，可防止离群值并保护量化准确性

针对大规模语言模型的离群值安全预训练创新，可防止离群值并保护量化准确性

GenRecal，一个用于轻量级高性能的通用蒸馏框架

GenRecal，一个用于轻量级高性能的通用蒸馏框架

超解析内存网络：改变 Transformer 内存效率的新方法

超解析内存网络：改变 Transformer 内存效率的新方法

Hymba，一种挑战小型 LLM 极限的新架构

Hymba，一种挑战小型 LLM 极限的新架构

稳定流：图像生成背后 "真正重要的层次 "可视化

稳定流：图像生成背后 "真正重要的层次 "可视化

跨层关注大大减少了变压器内存

跨层关注大大减少了变压器内存

[SA-FedLoRA] 降低联合学习通信成本的方法

[SA-FedLoRA] 降低联合学习通信成本的方法

压缩传感革命：自动验证算法证明了神经网络的准确性

压缩传感革命：自动验证算法证明了神经网络的准确性

[BitNet B1.58] 模型参数用三个值表示，精度优于 Llama！

[BitNet B1.58] 模型参数用三个值表示，精度优于 Llam ...

苹果公司在内存容量有限的设备上实现高效的大规模语言模型推理

苹果公司在内存容量有限的设备上实现高效的大规模语言模型推理

I-ViT：以整数类型计算 ViT！此外，还提供由 I-BERT 技术发展而来的 Shiftmax 和 ShiftGELU！

I-ViT：以整数类型计算 ViT！此外，还提供由 I-BERT 技术 ...

ImageNet预学习模型的修剪在下游任务中是如何进行的？

ImageNet预学习模型的修剪在下游任务中是如何进行的？

在物联网设备上运行的神经网路的架构探索方法。

在物联网设备上运行的神经网路的架构探索方法。

无条件的GANs的模型压缩

无条件的GANs的模型压缩

"LayerDrop "提议；Dropout层，而不是权重或节点！

"LayerDrop "提议；Dropout层，而不是权重或节点！

手机上实行GAN! 结合压缩技术减重，"GAN瘦身"

手机上实行GAN! 结合压缩技术减重，"GAN瘦身"

BERT For The Poor：用简单的技术降低复杂模型的权重，用有限的资源实现性能最大化的技术!

BERT For The Poor：用简单的技术降低复杂模型的权重，用 ...