GoogleのDeepMindが囲碁のルールを自ら学習することでAlphaZeroを凌駕する強化学習手法「Muzero」を提案。 GoogleのDeepMindが囲碁のルールを自ら学習することでAlp ... 2019年12月20日 論文
訓練データ分布の"外側"の生成!?State of the ArtのGAN「COCO-GAN」 訓練データ分布の"外側"の生成!?State of the ArtのG ... 2019年12月11日 機械学習
エネルギー保存則を満足する物体運動の予測を可能とする Hamiltonian Neural Networks エネルギー保存則を満足する物体運動の予測を可能とする Hamilton ... 2019年11月19日 深層学習
そのリコメンド、本当に効果ありますか?accuracyではなくupliftで学習することでリコメンドは進化する。 そのリコメンド、本当に効果ありますか?accuracyではなくupli ... 2019年11月18日 機械学習
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
Seed Diffusion Preview:高速推論と高性能を両立する次世代コード生成モデル Seed Diffusion Preview:高速推論と高性能を両立す ... 2025年08月13日 LLM-Paper
GPT-4oレベルの画像生成を民主化する:Janus-4oとShareGPT-4o-Imageの挑戦 GPT-4oレベルの画像生成を民主化する:Janus-4oとShare ... 2025年07月24日 LLM-Paper
rStar2-Agent: GRPO-RoCによる効率的エージェント型強化学習で到達した最先端の数理推論 rStar2-Agent: GRPO-RoCによる効率的エージェント型 ... 2025年08月31日 LLM-Paper