【Versatile Diffusion】テキストと画像を統合的に扱う拡散モデル 【Versatile Diffusion】テキストと画像を統合的に扱う ... 2023年12月21日 Diffusion Model
大規模言語モデルによる「UI Grammer」を用いた革新的なモバイルUIデザイン!? 大規模言語モデルによる「UI Grammer」を用いた革新的なモバイル ... 2023年12月19日 Large language models
大学レベルの教養に挑む: 大規模マルチモーダルモデルのための新ベンチマーク「MMMU」 大学レベルの教養に挑む: 大規模マルチモーダルモデルのための新ベンチマ ... 2023年12月18日 Large language models
プライバシーを尊重し、複数タスクに利用可能な新しい顔画像データセット「マルチタスクフェイス(MTF)」 プライバシーを尊重し、複数タスクに利用可能な新しい顔画像データセット「 ... 2023年12月15日 Face Recognition
FRCSyn Challengeが示す合成データセットによる顔認識技術の可能性(FRCSyn Challenge at WACV ... FRCSyn Challengeが示す合成データセットによる顔認識技術 ... 2023年12月11日 Face Recognition
IDiff-Face: 合成データによる顔認識技術の進化と法的・倫理的課題への対処 IDiff-Face: 合成データによる顔認識技術の進化と法的・倫理的 ... 2023年11月29日 Face Recognition
AIと倫理:合成した顔画像のデータセットで顔認識アルゴリズムのバイアスの影響をより正確に分析!! AIと倫理:合成した顔画像のデータセットで顔認識アルゴリズムのバイアス ... 2023年11月27日 Face Recognition
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
「言葉」で指示して「画像」で探す!OWL-ViTが実現するオープンボキャブラリー物体検出 「言葉」で指示して「画像」で探す!OWL-ViTが実現するオープンボキ ... 2025年02月28日 Neural Network
【Swin Transformer】今こそ押さえたいTransformer系画像認識モデル 【Swin Transformer】今こそ押さえたいTransform ... 2024年03月22日 画像認識