「Transformer」の記事一覧 | AI-SCHOLAR.TECH | AI-SCHOLAR | AI：(人工知能)論文・技術情報メディア

Skywork UniPic：高効率で画像理解・生成・編集を統合する次世代マルチモーダルモデル

Skywork UniPic：高効率で画像理解・生成・編集を統合する次 ...

2025年08月13日 LLM-Paper

Seed Diffusion Preview：高速推論と高性能を両立する次世代コード生成モデル

Seed Diffusion Preview：高速推論と高性能を両立す ...

2025年08月13日 LLM-Paper

アウトライヤーを防いで量子化精度を守る、大規模言語モデル向けOutlier-Safe Pre-Trainingの革新

多話者音声認識の新潮流！DiCoWとDiariZenによる高精度システムの挑戦

多話者音声認識の新潮流！DiCoWとDiariZenによる高精度システ ...

2025年07月03日 LLM-Paper

Ultra-Sparse Memory Network：Transformerの記憶効率を変える新手法

Ultra-Sparse Memory Network：Transfo ...

2025年06月23日 LLM-Paper

小型LLMの限界を突破する新アーキテクチャ『Hymba』

2025年06月23日 LLM-Paper

Insight-V：視覚と思考をつなぐマルチモーダル推論の新戦略

2025年06月23日 LLM-Paper

Stable Flow: 画像生成を支える“本当に重要な層”を可視化

2025年06月22日 LLM-Paper

「言葉」で指示して「画像」で探す！OWL-ViTが実現するオープンボキャブラリー物体検出

「言葉」で指示して「画像」で探す！OWL-ViTが実現するオープンボキ ...

2025年02月28日 Neural Network

【超絶無理難題級の分類タスク！？】WHFEMDアルゴリズムで構音障害音声の特長を正確かつ効率的に捉え分類せよ

【超絶無理難題級の分類タスク！？】WHFEMDアルゴリズムで構音障害音 ...

2025年02月14日 Speech Recognition for the Dysarthric

推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力が大きく向上！？

推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力 ...

2024年12月26日 Prompting Method

Cross-Layer AttentionによってTransformerのメモリを大幅に削減

Cross-Layer AttentionによってTransforme ...

2024年12月10日 Transformer

YesBut：VLMに皮肉や風刺画を理解させるデータセットの登場！

2024年11月22日 dataset

【SCoRe】LLMの自己修正能力を高める強化学習！多段階的にエラーを特定して修正する

【SCoRe】LLMの自己修正能力を高める強化学習！多段階的にエラーを ...

2024年10月31日 Large language models

数学教育を変革するAI、大規模言語モデルを活用した数学問題解決の可能性と課題

数学教育を変革するAI、大規模言語モデルを活用した数学問題解決の可能性 ...

2024年10月16日 Large language models

より良いAttention機構がLLMの長文処理の性能を向上させる！

2024年09月30日 Large language models

Transformer

Skywork UniPic：高効率で画像理解・生成・編集を統合する次世代マルチモーダルモデル

Skywork UniPic：高効率で画像理解・生成・編集を統合する次 ...

Seed Diffusion Preview：高速推論と高性能を両立する次世代コード生成モデル

Seed Diffusion Preview：高速推論と高性能を両立す ...

アウトライヤーを防いで量子化精度を守る、大規模言語モデル向けOutlier-Safe Pre-Trainingの革新

アウトライヤーを防いで量子化精度を守る、大規模言語モデル向けOutli ...

画像を忘れないAIへ、CoMemoが切り拓く次世代視覚と言語モデル

画像を忘れないAIへ、CoMemoが切り拓く次世代視覚と言語モデル

PictSure：視覚埋め込みの力でFew-Shot分類に挑む新手法

PictSure：視覚埋め込みの力でFew-Shot分類に挑む新手法

多話者音声認識の新潮流！DiCoWとDiariZenによる高精度システムの挑戦

多話者音声認識の新潮流！DiCoWとDiariZenによる高精度システ ...

Ultra-Sparse Memory Network：Transformerの記憶効率を変える新手法

Ultra-Sparse Memory Network：Transfo ...

小型LLMの限界を突破する新アーキテクチャ『Hymba』

小型LLMの限界を突破する新アーキテクチャ『Hymba』

Insight-V：視覚と思考をつなぐマルチモーダル推論の新戦略

Insight-V：視覚と思考をつなぐマルチモーダル推論の新戦略

Stable Flow: 画像生成を支える“本当に重要な層”を可視化

Stable Flow: 画像生成を支える“本当に重要な層”を可視化

「言葉」で指示して「画像」で探す！OWL-ViTが実現するオープンボキャブラリー物体検出

「言葉」で指示して「画像」で探す！OWL-ViTが実現するオープンボキ ...

【超絶無理難題級の分類タスク！？】WHFEMDアルゴリズムで構音障害音声の特長を正確かつ効率的に捉え分類せよ

【超絶無理難題級の分類タスク！？】WHFEMDアルゴリズムで構音障害音 ...

推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力が大きく向上！？

推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力 ...

Cross-Layer AttentionによってTransformerのメモリを大幅に削減

Cross-Layer AttentionによってTransforme ...

YesBut：VLMに皮肉や風刺画を理解させるデータセットの登場！

YesBut：VLMに皮肉や風刺画を理解させるデータセットの登場！

【SCoRe】LLMの自己修正能力を高める強化学習！多段階的にエラーを特定して修正する

【SCoRe】LLMの自己修正能力を高める強化学習！多段階的にエラーを ...

数学教育を変革するAI、大規模言語モデルを活用した数学問題解決の可能性と課題

数学教育を変革するAI、大規模言語モデルを活用した数学問題解決の可能性 ...

より良いAttention機構がLLMの長文処理の性能を向上させる！

より良いAttention機構がLLMの長文処理の性能を向上させる！