物理とデジタルを融合する次世代AI『Embodied Web Agents』の挑戦 物理とデジタルを融合する次世代AI『Embodied Web Agen ... 2025年07月05日 LLM-Paper
大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAUIの可能性 大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAU ... 2025年01月24日 Large language models
推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力が大きく向上!? 推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力 ... 2024年12月26日 Prompting Method
【SKETCHPAD】マルチモーダル言語モデルの推論を中間スケッチで強化 【SKETCHPAD】マルチモーダル言語モデルの推論を中間スケッチで強 ... 2024年12月18日 Large language models
【Plot2Code】マルチモーダルLLMのコード生成をテストするベンチマーク 【Plot2Code】マルチモーダルLLMのコード生成をテストするベン ... 2024年12月17日 Large language models
Cross-Layer AttentionによってTransformerのメモリを大幅に削減 Cross-Layer AttentionによってTransforme ... 2024年12月10日 Transformer
【MMSEARCH】画像とテキストを統合したマルチモーダル検索システム 【MMSEARCH】画像とテキストを統合したマルチモーダル検索システム 2024年10月29日 Large language models
生成モデルと大規模言語モデルによって進化するレコメンドシステムGen-RecSysの体系的な調査 生成モデルと大規模言語モデルによって進化するレコメンドシステムGen- ... 2024年10月28日 Large language models
【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM 【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM 2024年10月01日 Large language models
【NVLM】画像と言語タスクにおいてGPT-4oを上回るマルチモーダルLLM 【NVLM】画像と言語タスクにおいてGPT-4oを上回るマルチモーダル ... 2024年09月27日 Large language models
モバイルUI向けマルチモーダル大規模言語モデル「Ferret-UI」 モバイルUI向けマルチモーダル大規模言語モデル「Ferret-UI」 2024年09月02日 Large language models