最新AI論文をキャッチアップ

AI-SCHOLARとは？

LongVie：マルチモーダル制御で実現する1分超高品質動画生成の新時代

LongVie：マルチモーダル制御で実現する1分超高品質動画生成の新時 ...

2025年08月16日 LLM-Paper

Skywork UniPic：高効率で画像理解・生成・編集を統合する次世代マルチモーダルモデル

Skywork UniPic：高効率で画像理解・生成・編集を統合する次 ...

2025年08月13日 LLM-Paper

MATE：マルチエージェントによるアクセシビリティ特化モダリティ変換フレームワーク

MATE：マルチエージェントによるアクセシビリティ特化モダリティ変換フ ...

2025年08月12日 LLM-Paper

RoboTwin 2.0：両腕操作ロボットのためのスケーラブルな合成データ生成とベンチマーク設計

RoboTwin 2.0：両腕操作ロボットのためのスケーラブルな合成デ ...

2025年07月29日 LLM-Paper

DualTHORとは何か？双腕ロボットの現実適応力を高める次世代シミュレータ

DualTHORとは何か？双腕ロボットの現実適応力を高める次世代シミュ ...

2025年07月28日 LLM-Paper

GPT-4oレベルの画像生成を民主化する：Janus-4oとShareGPT-4o-Imageの挑戦

GPT-4oレベルの画像生成を民主化する：Janus-4oとShare ...

2025年07月24日 LLM-Paper

FedNano：大規模マルチモーダルモデルを軽量・効率的に分散学習

FedNano：大規模マルチモーダルモデルを軽量・効率的に分散学習

2025年07月24日 LLM-Paper

ImmerseGen：エージェントが導く、軽量×高臨場の次世代VRシーン生成

ImmerseGen：エージェントが導く、軽量×高臨場の次世代VRシー ...

2025年07月24日 LLM-Paper

画像を忘れないAIへ、CoMemoが切り拓く次世代視覚と言語モデル

画像を忘れないAIへ、CoMemoが切り拓く次世代視覚と言語モデル

2025年07月18日 LLM-Paper

SCIVERが拓く未来：マルチモーダル科学的主張検証の最前線

SCIVERが拓く未来：マルチモーダル科学的主張検証の最前線

2025年07月13日 LLM-Paper

物理とデジタルを融合する次世代AI『Embodied Web Agents』の挑戦

物理とデジタルを融合する次世代AI『Embodied Web Agen ...

2025年07月05日 LLM-Paper

軽量高性能を実現する汎用蒸留フレームワーク『GenRecal』

軽量高性能を実現する汎用蒸留フレームワーク『GenRecal』

2025年07月01日 LLM-Paper

ProtoReasoning: 論理と計画で磨く汎用推論能力

ProtoReasoning: 論理と計画で磨く汎用推論能力

2025年06月30日 LLM-Paper

マルチモーダルLLMの推論性能を革新する混合優先最適化の提案！

マルチモーダルLLMの推論性能を革新する混合優先最適化の提案！

2025年06月30日 LLM-Paper

UnifiedCrawl：低リソース言語データ収集と効率的LLM適応の新アプローチ

UnifiedCrawl：低リソース言語データ収集と効率的LLM適応の ...

2025年06月30日その他

Insight-V：視覚と思考をつなぐマルチモーダル推論の新戦略

Insight-V：視覚と思考をつなぐマルチモーダル推論の新戦略

2025年06月23日 LLM-Paper

大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAUIの可能性

大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAU ...

2025年01月24日 Large language models

推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力が大きく向上！？

推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力 ...

2024年12月26日 Prompting Method