最新AI論文をキャッチアップ

AI-SCHOLARとは？

Wavelet Diffusion: 最高速の拡散モデル

Wavelet Diffusion: 最高速の拡散モデル

Image generation: 2024年04月16日

戦略的知識を統合する新たなプロンプト手法、SCoT(Strategic Chain-of-Thought)が登場！

戦略的知識を統合する新たなプロンプト手法、SCoT(Strategic ...

2025年02月03日 Chain-of-Thought

LLMの弱点を暴く「TruthEval」データセットの構築と分析

LLMの弱点を暴く「TruthEval」データセットの構築と分析

2025年01月31日 Large language models

MVANet: 背景削除の最強モデル

MVANet: 背景削除の最強モデル

2025年01月31日 Neural Network

大規模言語モデルのスポーツの理解力を測る新データセット「SportQA」

大規模言語モデルのスポーツの理解力を測る新データセット「SportQA ...

2025年01月30日 Large language models

CLAP-IPA: 音声とIPA列の対照学習による多言語音声表現の獲得

CLAP-IPA: 音声とIPA列の対照学習による多言語音声表現の獲得

2025年01月30日 natural language processing

【愛犬も話したZero-shot Learning】AI音声クローンとリップシンキングの検証と解説

【愛犬も話したZero-shot Learning】AI音声クローンと ...

2025年01月29日 Neural Network

スポーツベッティングにおけるサッカーの試合予測に挑む機械学習モデル

スポーツベッティングにおけるサッカーの試合予測に挑む機械学習モデル

2025年01月29日 Sports Analytics

人間の好みに基づく、AIアシスタントの新たな評価方法の提案

人間の好みに基づく、AIアシスタントの新たな評価方法の提案

2025年01月29日 Large language models

PosterLlama: 言語モデルの設計能力とコンテンツを考慮したレイアウト生成

PosterLlama: 言語モデルの設計能力とコンテンツを考慮したレ ...

2025年01月28日 layout-gen

MaskDiT: 画像生成向けた低学習コストの拡散モデル

MaskDiT: 画像生成向けた低学習コストの拡散モデル

2025年01月27日 Image generation

大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAUIの可能性

大規模言語モデルが変える音楽教育の未来、Flute X GPTとLAU ...

2025年01月24日 Large language models

2024年パリ五輪ハンドボールの結果予測と、LLMを活用した予測根拠の説明

2024年パリ五輪ハンドボールの結果予測と、LLMを活用した予測根拠の ...

2025年01月23日 Large language models

製造業向けロボット操作のデモからの学習のロードマップ

製造業向けロボット操作のデモからの学習のロードマップ

2025年01月22日 robot

長編動画の理解力を試す新たなベンチマーク「Vript-Hard」

長編動画の理解力を試す新たなベンチマーク「Vript-Hard」

2025年01月21日 Large language models

歩行分析から健康管理までスマートシューズの進化と課題

歩行分析から健康管理までスマートシューズの進化と課題

2025年01月20日 Healthcare

商品カテゴリやブランドのスタイルを考慮したEコマース背景画像生成

商品カテゴリやブランドのスタイルを考慮したEコマース背景画像生成

2025年01月17日 Image generation

新しい画像編集手法「イミテイティブ編集」を実現するMimicBrushを提案

新しい画像編集手法「イミテイティブ編集」を実現するMimicBrush ...

2025年01月16日 Image Editing

洪水検出の課題を解決する新データセット「UrbanSARFloods」

洪水検出の課題を解決する新データセット「UrbanSARFloods」

2025年01月15日 Datasets

Wavelet Diffusion: 最高速の拡散モデル

Wavelet Diffusion: 最高速の拡散モデル

2024年04月16日 Image generation

ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開

ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ...

2024年04月08日 Large language models

【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場

【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ...

2024年04月18日機械学習

MBTIを用いてLLMに人間の性格を評価させるフレームワークが登場！

MBTIを用いてLLMに人間の性格を評価させるフレームワークが登場！

2024年04月22日 ChatGPT

VCRL: 報酬分散で学習難易度を制御するLLM強化学習の新アプローチ

VCRL: 報酬分散で学習難易度を制御するLLM強化学習の新アプローチ

2025年10月03日 LLM-Paper

お手軽！高精度！異常検知モデルPatchCoreの魅力

お手軽！高精度！異常検知モデルPatchCoreの魅力

2023年07月12日 Object Detection

【DPO】強化学習を用いずに大規模言語モデルをユーザの好みに直接合わせる手法

【DPO】強化学習を用いずに大規模言語モデルをユーザの好みに直接合わせ ...

2024年02月02日 RLHF

スポーツベッティングにおけるサッカーの試合予測に挑む機械学習モデル

スポーツベッティングにおけるサッカーの試合予測に挑む機械学習モデル

2025年01月29日 Sports Analytics

【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM

【Qwen2-VL】画像や動画を異なる解像度で処理できる最新VLM

2024年10月01日 Large language models

ViTに優った！大規模CNNの新たな基盤モデル！: InternImage

ViTに優った！大規模CNNの新たな基盤モデル！: InternIma ...

2023年01月13日深層学習

ImmerseGen：エージェントが導く、軽量×高臨場の次世代VRシーン生成

ImmerseGen：エージェントが導く、軽量×高臨場の次世代VRシー ...

2025年07月24日 LLM-Paper

【Swin Transformer】今こそ押さえたいTransformer系画像認識モデル

【Swin Transformer】今こそ押さえたいTransform ...

2024年03月22日画像認識

自己教師あり学習で感情・笑い・性格を読み解く社会的AI『Social-MAE』の挑戦

自己教師あり学習で感情・笑い・性格を読み解く社会的AI『Social- ...

2025年10月02日 LLM-Paper

U-NetとTransformerを合体！医用画像セグメンテーションのための新しいネットワークSwin Unetを紹介｡

U-NetとTransformerを合体！医用画像セグメンテーションの ...

2022年05月20日 medical

協賛企業

メディアパートナー