Cross-Layer AttentionによってTransformerのメモリを大幅に削減 Cross-Layer AttentionによってTransforme ... 2024年12月10日 Transformer
圧縮センシング革命:自動検証アルゴリズムが証明するニューラルネットワークの正確性 圧縮センシング革命:自動検証アルゴリズムが証明するニューラルネットワー ... 2024年10月24日 Neural Network
【BitNet b1.58】モデルパラメータを3値で表現しLlama以上の精度を達成!? 【BitNet b1.58】モデルパラメータを3値で表現しLlama以 ... 2024年08月27日 Large language models
アップルがメモリ容量が限られたデバイス上で効率的な大規模言語モデルの推論を実現 アップルがメモリ容量が限られたデバイス上で効率的な大規模言語モデルの推 ... 2024年01月29日 Large language models
I-ViT:ViTを整数型で計算!?I-BERTの技術を進化させたShiftmax、ShiftGELUも登場! I-ViT:ViTを整数型で計算!?I-BERTの技術を進化させたSh ... 2023年11月16日 Transformer
GANをスマホで動かす!圧縮手法の組み合わせで軽量化、「GAN Slimming」 GANをスマホで動かす!圧縮手法の組み合わせで軽量化、「GAN Sli ... 2020年09月18日 GAN(敵対的生成ネットワーク)
「貧者のためのBERT」:複雑なモデルを単純な手法で軽量化し、限られたリソースで最大限のパフォーマンスを発揮する技術! 「貧者のためのBERT」:複雑なモデルを単純な手法で軽量化し、限られた ... 2020年05月23日 Pruning