モバイルUI向けマルチモーダル大規模言語モデル「Ferret-UI」 モバイルUI向けマルチモーダル大規模言語モデル「Ferret-UI」 2024年09月02日 Large language models
【音声と画像の融合!?】マルチモーダル手法”AV-HuBERT”は構音障害者音声認識でも輝くのか! 【音声と画像の融合!?】マルチモーダル手法”AV-HuBERT”は構音 ... 2024年08月31日 Speech Recognition for the Dysarthric
【Metaが開発した人工知能!?】従来の自己教師あり学習モデルとは一線を画す"HuBERT"モデルの性能はいかに 【Metaが開発した人工知能!?】従来の自己教師あり学習モデルとは一線 ... 2024年08月29日 AI for Science
【BitNet b1.58】モデルパラメータを3値で表現しLlama以上の精度を達成!? 【BitNet b1.58】モデルパラメータを3値で表現しLlama以 ... 2024年08月27日 Large language models
GPT-4、Claude 3 Opus、Gemini 1.0 Ultraが挑む制御工学の新境地 GPT-4、Claude 3 Opus、Gemini 1.0 Ultr ... 2024年08月22日 Optimization and Control
DNA解析から遺伝子発現予測、大規模言語モデルによる生物情報学への応用 DNA解析から遺伝子発現予測、大規模言語モデルによる生物情報学への応用 2024年08月21日 Large language models
音声から自然な3Dトーキングフェイスを生成する「AVI-Talking」 音声から自然な3Dトーキングフェイスを生成する「AVI-Talking ... 2024年08月17日 Face Recognition
インド固有の社会的バイアスを測定するための新データセット「IndiBias」 インド固有の社会的バイアスを測定するための新データセット「IndiBi ... 2024年08月16日 Large language models
【ゼロショット転移学習】多言語コーパスデータから、未学習言語の音声認識を行なう革新的な技術!? 【ゼロショット転移学習】多言語コーパスデータから、未学習言語の音声認識 ... 2024年08月07日 Speech Recognition for the Dysarthric
【ReALM】LLMによる画面上のエンティティ位置を活用した参照解決 【ReALM】LLMによる画面上のエンティティ位置を活用した参照解決 2024年07月31日 Large language models
AIによる口頭試験シミュレーション、STEM教育に革命をもたらすLLM AIによる口頭試験シミュレーション、STEM教育に革命をもたらすLLM 2024年07月30日 Large language models