MLPの代わりにKolmogorov-Arnold Network(KAN)を導入してモデルの表現力と性能を向上 MLPの代わりにKolmogorov-Arnold Network(K ... 2024年09月24日 Large language models
【Google × Meta】XLS-R大規模モデルで音声認識と音声翻訳をこなす 【Google × Meta】XLS-R大規模モデルで音声認識と音声翻 ... 2024年09月21日 Speech Recognition for the Dysarthric
【RetrievalAttention】長い文脈を処理するLLMの効率を向上! 【RetrievalAttention】長い文脈を処理するLLMの効率 ... 2024年09月19日 Large language models
インドの高校レベルの物理の多肢選択問題に特化したLLMチャットボットの開発 インドの高校レベルの物理の多肢選択問題に特化したLLMチャットボットの ... 2024年09月09日 Large language models
失敗から学ぶLLM、新しいベンチマーク「COTERRORSET」の提案 失敗から学ぶLLM、新しいベンチマーク「COTERRORSET」の提案 2024年09月05日 Large language models
モバイルUI向けマルチモーダル大規模言語モデル「Ferret-UI」 モバイルUI向けマルチモーダル大規模言語モデル「Ferret-UI」 2024年09月02日 Large language models
【音声と画像の融合!?】マルチモーダル手法”AV-HuBERT”は構音障害者音声認識でも輝くのか! 【音声と画像の融合!?】マルチモーダル手法”AV-HuBERT”は構音 ... 2024年08月31日 Speech Recognition for the Dysarthric
【Metaが開発した人工知能!?】従来の自己教師あり学習モデルとは一線を画す"HuBERT"モデルの性能はいかに 【Metaが開発した人工知能!?】従来の自己教師あり学習モデルとは一線 ... 2024年08月29日 AI for Science
【BitNet b1.58】モデルパラメータを3値で表現しLlama以上の精度を達成!? 【BitNet b1.58】モデルパラメータを3値で表現しLlama以 ... 2024年08月27日 Large language models
GPT-4、Claude 3 Opus、Gemini 1.0 Ultraが挑む制御工学の新境地 GPT-4、Claude 3 Opus、Gemini 1.0 Ultr ... 2024年08月22日 Optimization and Control
DNA解析から遺伝子発現予測、大規模言語モデルによる生物情報学への応用 DNA解析から遺伝子発現予測、大規模言語モデルによる生物情報学への応用 2024年08月21日 Large language models