Skywork UniPic:高効率で画像理解・生成・編集を統合する次世代マルチモーダルモデル Skywork UniPic:高効率で画像理解・生成・編集を統合する次 ... 2025年08月13日 LLM-Paper
MATE:マルチエージェントによるアクセシビリティ特化モダリティ変換フレームワーク MATE:マルチエージェントによるアクセシビリティ特化モダリティ変換フ ... 2025年08月12日 LLM-Paper
RoboTwin 2.0:両腕操作ロボットのためのスケーラブルな合成データ生成とベンチマーク設計 RoboTwin 2.0:両腕操作ロボットのためのスケーラブルな合成デ ... 2025年07月29日 LLM-Paper
GPT-4oレベルの画像生成を民主化する:Janus-4oとShareGPT-4o-Imageの挑戦 GPT-4oレベルの画像生成を民主化する:Janus-4oとShare ... 2025年07月24日 LLM-Paper
物理とデジタルを融合する次世代AI『Embodied Web Agents』の挑戦 物理とデジタルを融合する次世代AI『Embodied Web Agen ... 2025年07月05日 LLM-Paper
大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAUIの可能性 大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAU ... 2025年01月24日 Large language models
推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力が大きく向上!? 推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力 ... 2024年12月26日 Prompting Method