モバイルUI向けマルチモーダル大規模言語モデル「Ferret-UI」 モバイルUI向けマルチモーダル大規模言語モデル「Ferret-UI」 2024年09月02日 Large language models
【音声と画像の融合!?】マルチモーダル手法”AV-HuBERT”は構音障害者音声認識でも輝くのか! 【音声と画像の融合!?】マルチモーダル手法”AV-HuBERT”は構音 ... 2024年08月31日 Speech Recognition for the Dysarthric
インフォグラフィックスからUIまで画像とテキストを理解する「ScreenAI」 インフォグラフィックスからUIまで画像とテキストを理解する「Scree ... 2024年06月24日 Large language models