画像の局所的なスタイル情報を反映した多様性のあるキャプション生成が可能に! 画像の局所的なスタイル情報を反映した多様性のあるキャプション生成が可能 ... 2022年10月28日 Image Caption
2つの視覚的特徴を統合し大幅な精度向上を達成した画像キャプション生成モデル、GRITが登場! 2つの視覚的特徴を統合し大幅な精度向上を達成した画像キャプション生成モ ... 2022年10月25日 Image Caption
絵画データセットに含まれる感情バイアスを取り除いたArtEmis v2.0が登場! 絵画データセットに含まれる感情バイアスを取り除いたArtEmis v2 ... 2022年10月14日 dataset
テキストから動画生成が可能なオープンソースモデルCogVideoが登場! テキストから動画生成が可能なオープンソースモデルCogVideoが登場 ... 2022年10月11日 Video Generation
より人間らしいリアルなジェスチャーを生成するための大規模データセットBEATが登場! より人間らしいリアルなジェスチャーを生成するための大規模データセットB ... 2022年09月20日 dataset
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
Seed Diffusion Preview:高速推論と高性能を両立する次世代コード生成モデル Seed Diffusion Preview:高速推論と高性能を両立す ... 2025年08月13日 LLM-Paper
GPT-4oレベルの画像生成を民主化する:Janus-4oとShareGPT-4o-Imageの挑戦 GPT-4oレベルの画像生成を民主化する:Janus-4oとShare ... 2025年07月24日 LLM-Paper
rStar2-Agent: GRPO-RoCによる効率的エージェント型強化学習で到達した最先端の数理推論 rStar2-Agent: GRPO-RoCによる効率的エージェント型 ... 2025年08月31日 LLM-Paper