10億人のペルソナから構築された大規模データセット、Persona Hubが登場! 10億人のペルソナから構築された大規模データセット、Persona H ... 2024年12月19日 persona-driven data synthesis
【SKETCHPAD】マルチモーダル言語モデルの推論を中間スケッチで強化 【SKETCHPAD】マルチモーダル言語モデルの推論を中間スケッチで強 ... 2024年12月18日 Large language models
Cross-Layer AttentionによってTransformerのメモリを大幅に削減 Cross-Layer AttentionによってTransforme ... 2024年12月10日 Transformer
ChatGPTを活用したAIエージェントによる、化学文献のマイニングの進化 ChatGPTを活用したAIエージェントによる、化学文献のマイニングの ... 2024年11月11日 Large language models
【InfiMM-WebMath-40B】24億の数学文書からなるデータセットでLLMの数学性能を向上させる! 【InfiMM-WebMath-40B】24億の数学文書からなるデータ ... 2024年10月30日 Datasets
大規模言語モデルにおけるデータ汚染分野の包括的な調査と「LLMSanitize」 大規模言語モデルにおけるデータ汚染分野の包括的な調査と「LLMSani ... 2024年10月28日 Large language models
数学教育を変革するAI、大規模言語モデルを活用した数学問題解決の可能性と課題 数学教育を変革するAI、大規模言語モデルを活用した数学問題解決の可能性 ... 2024年10月16日 Large language models
【beeFormer】推薦システムでのテキスト情報とインタラクションデータを組み合わせてTransformerを学習 【beeFormer】推薦システムでのテキスト情報とインタラクションデ ... 2024年09月25日 Large language models
MLPの代わりにKolmogorov-Arnold Network(KAN)を導入してモデルの表現力と性能を向上 MLPの代わりにKolmogorov-Arnold Network(K ... 2024年09月24日 Large language models
【RetrievalAttention】長い文脈を処理するLLMの効率を向上! 【RetrievalAttention】長い文脈を処理するLLMの効率 ... 2024年09月19日 Large language models
言語モデルの"頭の中"を可視化 - 知識グラフで解明するLLMsの内部メカニズム 言語モデルの"頭の中"を可視化 - 知識グラフで解明するLLMsの内部 ... 2024年09月03日 Computation and Language
【BitNet b1.58】モデルパラメータを3値で表現しLlama以上の精度を達成!? 【BitNet b1.58】モデルパラメータを3値で表現しLlama以 ... 2024年08月27日 Large language models