Skywork UniPic:高効率で画像理解・生成・編集を統合する次世代マルチモーダルモデル Skywork UniPic:高効率で画像理解・生成・編集を統合する次 ... 2025年08月13日 LLM-Paper
Seed Diffusion Preview:高速推論と高性能を両立する次世代コード生成モデル Seed Diffusion Preview:高速推論と高性能を両立す ... 2025年08月13日 LLM-Paper
【超絶無理難題級の分類タスク!?】WHFEMDアルゴリズムで構音障害音声の特長を正確かつ効率的に捉え分類せよ 【超絶無理難題級の分類タスク!?】WHFEMDアルゴリズムで構音障害音 ... 2025年02月14日 Speech Recognition for the Dysarthric
【いままでの常識を覆す論文!?】構音障害者の特性じゃなく、ノイズで分類わけされていた! 【いままでの常識を覆す論文!?】構音障害者の特性じゃなく、ノイズで分類 ... 2025年02月13日 Speech Recognition for the Dysarthric
推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力が大きく向上!? 推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力 ... 2024年12月26日 Prompting Method
構音障害者も高齢者も見捨てない、A2A変換器による音声認識率改善 構音障害者も高齢者も見捨てない、A2A変換器による音声認識率改善 2024年12月25日 Speech Recognition for the Dysarthric
ChatGPTを活用したAIエージェントによる、化学文献のマイニングの進化 ChatGPTを活用したAIエージェントによる、化学文献のマイニングの ... 2024年11月11日 Large language models
【SCoRe】LLMの自己修正能力を高める強化学習!多段階的にエラーを特定して修正する 【SCoRe】LLMの自己修正能力を高める強化学習!多段階的にエラーを ... 2024年10月31日 Large language models
【Qwen2.5-Coder】コード生成や補完、数学の推論タスクに特化したLLM 【Qwen2.5-Coder】コード生成や補完、数学の推論タスクに特化 ... 2024年10月11日 Large language models
【WavLM】すべての音声認識モデルを過去にする!?構造や性能はどうなっているのか? 【WavLM】すべての音声認識モデルを過去にする!?構造や性能はどうな ... 2024年09月30日 Speech Processing
大規模言語モデルを使用して執筆されたコンテンツに対する所有感覚と著作感覚 大規模言語モデルを使用して執筆されたコンテンツに対する所有感覚と著作感 ... 2024年09月25日 Large language models
【構音障害の重症度分類を自動化!?】wav2vec2をも上回るSALRの導入実験 【構音障害の重症度分類を自動化!?】wav2vec2をも上回るSALR ... 2024年09月22日 Speech Recognition for the Dysarthric
【Google × Meta】XLS-R大規模モデルで音声認識と音声翻訳をこなす 【Google × Meta】XLS-R大規模モデルで音声認識と音声翻 ... 2024年09月21日 Speech Recognition for the Dysarthric