ロボットが未知の複雑な挿入タスクを過去に集めたデータを用いて素早く適応するoffline Meta-RL Framework! ロボットが未知の複雑な挿入タスクを過去に集めたデータを用いて素早く適応 ... 2022年03月02日 強化学習
生成されたテキストの人間っぽさや面白さを高精度にモデル化:MAUVE 生成されたテキストの人間っぽさや面白さを高精度にモデル化:MAUVE 2022年02月25日 natural language processing
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
Seed Diffusion Preview:高速推論と高性能を両立する次世代コード生成モデル Seed Diffusion Preview:高速推論と高性能を両立す ... 2025年08月13日 LLM-Paper
GPT-4oレベルの画像生成を民主化する:Janus-4oとShareGPT-4o-Imageの挑戦 GPT-4oレベルの画像生成を民主化する:Janus-4oとShare ... 2025年07月24日 LLM-Paper
rStar2-Agent: GRPO-RoCによる効率的エージェント型強化学習で到達した最先端の数理推論 rStar2-Agent: GRPO-RoCによる効率的エージェント型 ... 2025年08月31日 LLM-Paper