AIエージェントがソフトウェア開発を行う仮想の会社「CHATDEV」を設立!? AIエージェントがソフトウェア開発を行う仮想の会社「CHATDEV」を ... 2023年09月06日 agent simulation
計算時間とメモリの壁を打破!Transformerの次世代モデルReformer 計算時間とメモリの壁を打破!Transformerの次世代モデルRef ... 2023年09月01日 Transformer
新データセット「ToolQA」:大規模言語モデルが外部ツールで問題解決する能力を評価 新データセット「ToolQA」:大規模言語モデルが外部ツールで問題解決 ... 2023年08月28日 Large language models
仮想環境でAIエージェントと他者の共同作業をシミュレーションするためのフレームワークが登場! 仮想環境でAIエージェントと他者の共同作業をシミュレーションするための ... 2023年08月25日 agent simulation
複数のペルソナを割り当てることでLLMの優れた問題解決能力を引き出すアプローチが登場! 複数のペルソナを割り当てることでLLMの優れた問題解決能力を引き出すア ... 2023年08月24日 agent simulation
ChatGPT(GPT-3.5とGPT-4)の性能が変化している?スタンフォード大学とカリフォルニア大学バークレー校の研究チームが ... ChatGPT(GPT-3.5とGPT-4)の性能が変化している?スタ ... 2023年08月23日 Large language models
分類器の出力確率は信用できるのか?calibration性能を向上させる損失関数「AdaFocal」 分類器の出力確率は信用できるのか?calibration性能を向上させ ... 2023年08月21日 Loss Function
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
Seed Diffusion Preview:高速推論と高性能を両立する次世代コード生成モデル Seed Diffusion Preview:高速推論と高性能を両立す ... 2025年08月13日 LLM-Paper
GPT-4oレベルの画像生成を民主化する:Janus-4oとShareGPT-4o-Imageの挑戦 GPT-4oレベルの画像生成を民主化する:Janus-4oとShare ... 2025年07月24日 LLM-Paper
rStar2-Agent: GRPO-RoCによる効率的エージェント型強化学習で到達した最先端の数理推論 rStar2-Agent: GRPO-RoCによる効率的エージェント型 ... 2025年08月31日 LLM-Paper