戦略的知識を統合する新たなプロンプト手法、SCoT(Strategic Chain-of-Thought)が登場! 戦略的知識を統合する新たなプロンプト手法、SCoT(Strategic ... 2025年02月03日 Chain-of-Thought
大規模言語モデルのスポーツの理解力を測る新データセット「SportQA」 大規模言語モデルのスポーツの理解力を測る新データセット「SportQA ... 2025年01月30日 Large language models
CLAP-IPA: 音声とIPA列の対照学習による多言語音声表現の獲得 CLAP-IPA: 音声とIPA列の対照学習による多言語音声表現の獲得 2025年01月30日 natural language processing
【愛犬も話したZero-shot Learning】AI音声クローンとリップシンキングの検証と解説 【愛犬も話したZero-shot Learning】AI音声クローンと ... 2025年01月29日 Neural Network
PosterLlama: 言語モデルの設計能力とコンテンツを考慮したレイアウト生成 PosterLlama: 言語モデルの設計能力とコンテンツを考慮したレ ... 2025年01月28日 layout-gen
大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAUIの可能性 大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAU ... 2025年01月24日 Large language models
2024年パリ五輪ハンドボールの結果予測と、LLMを活用した予測根拠の説明 2024年パリ五輪ハンドボールの結果予測と、LLMを活用した予測根拠の ... 2025年01月23日 Large language models
新しい画像編集手法「イミテイティブ編集」を実現するMimicBrushを提案 新しい画像編集手法「イミテイティブ編集」を実現するMimicBrush ... 2025年01月16日 Image Editing
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM 【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM 2024年10月01日 Large language models
【Swin Transformer】今こそ押さえたいTransformer系画像認識モデル 【Swin Transformer】今こそ押さえたいTransform ... 2024年03月22日 画像認識
自己教師あり学習で感情・笑い・性格を読み解く社会的AI『Social-MAE』の挑戦 自己教師あり学習で感情・笑い・性格を読み解く社会的AI『Social- ... 2025年10月02日 LLM-Paper
U-NetとTransformerを合体!医用画像セグメンテーションのための新しいネットワークSwin Unetを紹介。 U-NetとTransformerを合体!医用画像セグメンテーションの ... 2022年05月20日 medical