画像の局所的なスタイル情報を反映した多様性のあるキャプション生成が可能に! 画像の局所的なスタイル情報を反映した多様性のあるキャプション生成が可能 ... 2022年10月28日 Image Caption
2つの視覚的特徴を統合し大幅な精度向上を達成した画像キャプション生成モデル、GRITが登場! 2つの視覚的特徴を統合し大幅な精度向上を達成した画像キャプション生成モ ... 2022年10月25日 Image Caption
絵画データセットに含まれる感情バイアスを取り除いたArtEmis v2.0が登場! 絵画データセットに含まれる感情バイアスを取り除いたArtEmis v2 ... 2022年10月14日 dataset
テキストから動画生成が可能なオープンソースモデルCogVideoが登場! テキストから動画生成が可能なオープンソースモデルCogVideoが登場 ... 2022年10月11日 Video Generation
より人間らしいリアルなジェスチャーを生成するための大規模データセットBEATが登場! より人間らしいリアルなジェスチャーを生成するための大規模データセットB ... 2022年09月20日 dataset
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM 【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM 2024年10月01日 Large language models
【Swin Transformer】今こそ押さえたいTransformer系画像認識モデル 【Swin Transformer】今こそ押さえたいTransform ... 2024年03月22日 画像認識
U-NetとTransformerを合体!医用画像セグメンテーションのための新しいネットワークSwin Unetを紹介。 U-NetとTransformerを合体!医用画像セグメンテーションの ... 2022年05月20日 medical
【Qwen2.5-Coder】コード生成や補完、数学の推論タスクに特化したLLM 【Qwen2.5-Coder】コード生成や補完、数学の推論タスクに特化 ... 2024年10月11日 Large language models