物理とデジタルを融合する次世代AI『Embodied Web Agents』の挑戦 物理とデジタルを融合する次世代AI『Embodied Web Agen ... 2025年07月05日 LLM-Paper
多話者音声認識の新潮流!DiCoWとDiariZenによる高精度システムの挑戦 多話者音声認識の新潮流!DiCoWとDiariZenによる高精度システ ... 2025年07月03日 LLM-Paper
Ultra-Sparse Memory Network:Transformerの記憶効率を変える新手法 Ultra-Sparse Memory Network:Transfo ... 2025年06月23日 LLM-Paper
Do I Know This Entity? Knowledge Awareness and Hallucinations in ... Do I Know This Entity? Knowledge Aw ... 2025年06月19日 LLM-Paper
MagicDriveDiT: High-Resolution Long Video Generation for Autonomo ... MagicDriveDiT: High-Resolution Long ... 2025年06月16日 LLM-Paper
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM 【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM 2024年10月01日 Large language models
自己教師あり学習で感情・笑い・性格を読み解く社会的AI『Social-MAE』の挑戦 自己教師あり学習で感情・笑い・性格を読み解く社会的AI『Social- ... 2025年10月02日 LLM-Paper
【Swin Transformer】今こそ押さえたいTransformer系画像認識モデル 【Swin Transformer】今こそ押さえたいTransform ... 2024年03月22日 画像認識
U-NetとTransformerを合体!医用画像セグメンテーションのための新しいネットワークSwin Unetを紹介。 U-NetとTransformerを合体!医用画像セグメンテーションの ... 2022年05月20日 medical