「貧者のためのBERT」:複雑なモデルを単純な手法で軽量化し、限られたリソースで最大限のパフォーマンスを発揮する技術! 「貧者のためのBERT」:複雑なモデルを単純な手法で軽量化し、限られた ... 2020年05月23日 Pruning
層を並び替えるだけでSOTA!? 層の入れ替え・並び替えによって性能をあげたsandwich transformerとは? 層を並び替えるだけでSOTA!? 層の入れ替え・並び替えによって性能を ... 2020年05月09日 natural language processing