【OW-VISCap】見たことない物体にも注目 - オープンワールドビデオ理解の新アプローチ 【OW-VISCap】見たことない物体にも注目 - オープンワールドビ ... 2024年08月21日 Computer Vision
DNA解析から遺伝子発現予測、大規模言語モデルによる生物情報学への応用 DNA解析から遺伝子発現予測、大規模言語モデルによる生物情報学への応用 2024年08月21日 Large language models
【コマ撮り画像の高FPS動画化】フレーム補間AI技術RIFE&IFNetの仕組みと活用術 【コマ撮り画像の高FPS動画化】フレーム補間AI技術RIFE&IFNe ... 2024年08月20日 Image generation
音声から自然な3Dトーキングフェイスを生成する「AVI-Talking」 音声から自然な3Dトーキングフェイスを生成する「AVI-Talking ... 2024年08月17日 Face Recognition
インド固有の社会的バイアスを測定するための新データセット「IndiBias」 インド固有の社会的バイアスを測定するための新データセット「IndiBi ... 2024年08月16日 Large language models
【ゼロショット転移学習】多言語コーパスデータから、未学習言語の音声認識を行なう革新的な技術!? 【ゼロショット転移学習】多言語コーパスデータから、未学習言語の音声認識 ... 2024年08月07日 Speech Recognition for the Dysarthric
【ReALM】LLMによる画面上のエンティティ位置を活用した参照解決 【ReALM】LLMによる画面上のエンティティ位置を活用した参照解決 2024年07月31日 Large language models
AIによる口頭試験シミュレーション、STEM教育に革命をもたらすLLM AIによる口頭試験シミュレーション、STEM教育に革命をもたらすLLM 2024年07月30日 Large language models
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
自己教師あり学習で感情・笑い・性格を読み解く社会的AI『Social-MAE』の挑戦 自己教師あり学習で感情・笑い・性格を読み解く社会的AI『Social- ... 2025年10月02日 LLM-Paper
【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM 【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM 2024年10月01日 Large language models
【Swin Transformer】今こそ押さえたいTransformer系画像認識モデル 【Swin Transformer】今こそ押さえたいTransform ... 2024年03月22日 画像認識
U-NetとTransformerを合体!医用画像セグメンテーションのための新しいネットワークSwin Unetを紹介。 U-NetとTransformerを合体!医用画像セグメンテーションの ... 2022年05月20日 medical