Skywork UniPic:高効率で画像理解・生成・編集を統合する次世代マルチモーダルモデル Skywork UniPic:高効率で画像理解・生成・編集を統合する次 ... 2025年08月13日 LLM-Paper
Seed Diffusion Preview:高速推論と高性能を両立する次世代コード生成モデル Seed Diffusion Preview:高速推論と高性能を両立す ... 2025年08月13日 LLM-Paper
Forget-Me-Not: 長文プロンプト内の情報忘却を防ぐ簡易プロンプト技術の提案 Forget-Me-Not: 長文プロンプト内の情報忘却を防ぐ簡易プロ ... 2025年07月30日 LLM-Paper
Ultra-Sparse Memory Network:Transformerの記憶効率を変える新手法 Ultra-Sparse Memory Network:Transfo ... 2025年06月23日 LLM-Paper
PosterLlama: 言語モデルの設計能力とコンテンツを考慮したレイアウト生成 PosterLlama: 言語モデルの設計能力とコンテンツを考慮したレ ... 2025年01月28日 layout-gen
【InfiMM-WebMath-40B】24億の数学文書からなるデータセットでLLMの数学性能を向上させる! 【InfiMM-WebMath-40B】24億の数学文書からなるデータ ... 2024年10月30日 Datasets
数学教育を変革するAI、大規模言語モデルを活用した数学問題解決の可能性と課題 数学教育を変革するAI、大規模言語モデルを活用した数学問題解決の可能性 ... 2024年10月16日 Large language models
【Qwen2.5-Coder】コード生成や補完、数学の推論タスクに特化したLLM 【Qwen2.5-Coder】コード生成や補完、数学の推論タスクに特化 ... 2024年10月11日 Large language models
【NVLM】画像と言語タスクにおいてGPT-4oを上回るマルチモーダルLLM 【NVLM】画像と言語タスクにおいてGPT-4oを上回るマルチモーダル ... 2024年09月27日 Large language models
【beeFormer】推薦システムでのテキスト情報とインタラクションデータを組み合わせてTransformerを学習 【beeFormer】推薦システムでのテキスト情報とインタラクションデ ... 2024年09月25日 Large language models
【RetrievalAttention】長い文脈を処理するLLMの効率を向上! 【RetrievalAttention】長い文脈を処理するLLMの効率 ... 2024年09月19日 Large language models
【BitNet b1.58】モデルパラメータを3値で表現しLlama以上の精度を達成!? 【BitNet b1.58】モデルパラメータを3値で表現しLlama以 ... 2024年08月27日 Large language models