RoboTwin 2.0:両腕操作ロボットのためのスケーラブルな合成データ生成とベンチマーク設計 RoboTwin 2.0:両腕操作ロボットのためのスケーラブルな合成デ ... 2025年07月29日 LLM-Paper
GPT-4oレベルの画像生成を民主化する:Janus-4oとShareGPT-4o-Imageの挑戦 GPT-4oレベルの画像生成を民主化する:Janus-4oとShare ... 2025年07月24日 LLM-Paper
物理とデジタルを融合する次世代AI『Embodied Web Agents』の挑戦 物理とデジタルを融合する次世代AI『Embodied Web Agen ... 2025年07月05日 LLM-Paper
大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAUIの可能性 大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAU ... 2025年01月24日 Large language models
推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力が大きく向上!? 推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力 ... 2024年12月26日 Prompting Method
【SKETCHPAD】マルチモーダル言語モデルの推論を中間スケッチで強化 【SKETCHPAD】マルチモーダル言語モデルの推論を中間スケッチで強 ... 2024年12月18日 Large language models
【Plot2Code】マルチモーダルLLMのコード生成をテストするベンチマーク 【Plot2Code】マルチモーダルLLMのコード生成をテストするベン ... 2024年12月17日 Large language models
Cross-Layer AttentionによってTransformerのメモリを大幅に削減 Cross-Layer AttentionによってTransforme ... 2024年12月10日 Transformer