推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力が大きく向上!? 推論過程を書き出すホワイトボードを与えることで、LLMの視覚的推論能力 ... 2024年12月26日 Prompting Method
Cross-Layer AttentionによってTransformerのメモリを大幅に削減 Cross-Layer AttentionによってTransforme ... 2024年12月10日 Transformer
【SCoRe】LLMの自己修正能力を高める強化学習!多段階的にエラーを特定して修正する 【SCoRe】LLMの自己修正能力を高める強化学習!多段階的にエラーを ... 2024年10月31日 Large language models
数学教育を変革するAI、大規模言語モデルを活用した数学問題解決の可能性と課題 数学教育を変革するAI、大規模言語モデルを活用した数学問題解決の可能性 ... 2024年10月16日 Large language models
より良いAttention機構がLLMの長文処理の性能を向上させる! より良いAttention機構がLLMの長文処理の性能を向上させる! 2024年09月30日 Large language models
超長いプロンプト文を圧縮してメモリを抑えるGoogleの高性能LLM 超長いプロンプト文を圧縮してメモリを抑えるGoogleの高性能LLM 2024年08月27日 Large language models
GenTron: 画像生成、動画生成向けのDiffusion Transformers GenTron: 画像生成、動画生成向けのDiffusion Tran ... 2024年08月26日 Image generation
【IGModel】GNN+Attention機構を応用した手法が創薬における実用性の向上 【IGModel】GNN+Attention機構を応用した手法が創薬に ... 2024年07月28日 medical
【Mustango】音楽のドメイン知識を活用した音楽生成モデル 【Mustango】音楽のドメイン知識を活用した音楽生成モデル 2024年07月01日 Audio and Speech Processing
【VoiceCraft】業界最高レベルで自然な音声を合成できる言語モデル 【VoiceCraft】業界最高レベルで自然な音声を合成できる言語モデ ... 2024年07月01日 Speech Synthesis
トランスフォーマーと大規模言語モデルが作る化学研究と新薬開発の未来 トランスフォーマーと大規模言語モデルが作る化学研究と新薬開発の未来 2024年06月17日 Large language models