【Versatile Diffusion】テキストと画像を統合的に扱う拡散モデル 【Versatile Diffusion】テキストと画像を統合的に扱う ... 2023年12月21日 Diffusion Model
大規模言語モデルによる「UI Grammer」を用いた革新的なモバイルUIデザイン!? 大規模言語モデルによる「UI Grammer」を用いた革新的なモバイル ... 2023年12月19日 Large language models
大学レベルの教養に挑む: 大規模マルチモーダルモデルのための新ベンチマーク「MMMU」 大学レベルの教養に挑む: 大規模マルチモーダルモデルのための新ベンチマ ... 2023年12月18日 Large language models
プライバシーを尊重し、複数タスクに利用可能な新しい顔画像データセット「マルチタスクフェイス(MTF)」 プライバシーを尊重し、複数タスクに利用可能な新しい顔画像データセット「 ... 2023年12月15日 Face Recognition
FRCSyn Challengeが示す合成データセットによる顔認識技術の可能性(FRCSyn Challenge at WACV ... FRCSyn Challengeが示す合成データセットによる顔認識技術 ... 2023年12月11日 Face Recognition
IDiff-Face: 合成データによる顔認識技術の進化と法的・倫理的課題への対処 IDiff-Face: 合成データによる顔認識技術の進化と法的・倫理的 ... 2023年11月29日 Face Recognition
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
FakeParts:部分的ディープフェイクの脅威と検出限界を明らかにする新ベンチマーク FakeParts:部分的ディープフェイクの脅威と検出限界を明らかにす ... 2025年09月25日 LLM-Paper
【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM 【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM 2024年10月01日 Large language models
自己教師あり学習で感情・笑い・性格を読み解く社会的AI『Social-MAE』の挑戦 自己教師あり学習で感情・笑い・性格を読み解く社会的AI『Social- ... 2025年10月02日 LLM-Paper