【IGModel】GNN+Attention機構を応用した手法が創薬における実用性の向上 【IGModel】GNN+Attention機構を応用した手法が創薬に ... 2024年07月28日 medical
【Unit-DSR】HuBERTによる障害者音声から健常者音声への正規化 【Unit-DSR】HuBERTによる障害者音声から健常者音声への正規 ... 2024年07月26日 self-supervised learning
【Double Descent】なぜ「大きなモデル」と「大きなデータセット」が重要なのか 【Double Descent】なぜ「大きなモデル」と「大きなデータセ ... 2024年07月25日 Neural Network
【Chat-REC】LLMをベースとしたレコメンデーションシステムの提案 【Chat-REC】LLMをベースとしたレコメンデーションシステムの提 ... 2024年07月24日 Recommendation
【HiFi-GAN】単一GPUで22kHzの音声を生成可能なGANベースのボコーダー 【HiFi-GAN】単一GPUで22kHzの音声を生成可能なGANベー ... 2024年07月10日 Speech Synthesis
【Mustango】音楽のドメイン知識を活用した音楽生成モデル 【Mustango】音楽のドメイン知識を活用した音楽生成モデル 2024年07月01日 Audio and Speech Processing
【VoiceCraft】業界最高レベルで自然な音声を合成できる言語モデル 【VoiceCraft】業界最高レベルで自然な音声を合成できる言語モデ ... 2024年07月01日 Speech Synthesis
大規模言語モデルによる法律サービスの変革!速度と正確性で人間を超える? 大規模言語モデルによる法律サービスの変革!速度と正確性で人間を超える? 2024年06月28日 Large language models
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
自己教師あり学習で感情・笑い・性格を読み解く社会的AI『Social-MAE』の挑戦 自己教師あり学習で感情・笑い・性格を読み解く社会的AI『Social- ... 2025年10月02日 LLM-Paper
【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM 【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM 2024年10月01日 Large language models
【Swin Transformer】今こそ押さえたいTransformer系画像認識モデル 【Swin Transformer】今こそ押さえたいTransform ... 2024年03月22日 画像認識
U-NetとTransformerを合体!医用画像セグメンテーションのための新しいネットワークSwin Unetを紹介。 U-NetとTransformerを合体!医用画像セグメンテーションの ... 2022年05月20日 medical