【Ferret】LLMの分散環境での全パラメータ調整を効率化する手法!通信コストを大幅に削減しモデル精度を向上 【Ferret】LLMの分散環境での全パラメータ調整を効率化する手法! ... 2024年09月26日 Large language models
【beeFormer】推薦システムでのテキスト情報とインタラクションデータを組み合わせてTransformerを学習 【beeFormer】推薦システムでのテキスト情報とインタラクションデ ... 2024年09月25日 Large language models
大規模言語モデルを使用して執筆されたコンテンツに対する所有感覚と著作感覚 大規模言語モデルを使用して執筆されたコンテンツに対する所有感覚と著作感 ... 2024年09月25日 Large language models
MLPの代わりにKolmogorov-Arnold Network(KAN)を導入してモデルの表現力と性能を向上 MLPの代わりにKolmogorov-Arnold Network(K ... 2024年09月24日 Large language models
【RetrievalAttention】長い文脈を処理するLLMの効率を向上! 【RetrievalAttention】長い文脈を処理するLLMの効率 ... 2024年09月19日 Large language models
インドの高校レベルの物理の多肢選択問題に特化したLLMチャットボットの開発 インドの高校レベルの物理の多肢選択問題に特化したLLMチャットボットの ... 2024年09月09日 Large language models
失敗から学ぶLLM、新しいベンチマーク「COTERRORSET」の提案 失敗から学ぶLLM、新しいベンチマーク「COTERRORSET」の提案 2024年09月05日 Large language models
言語モデルの"頭の中"を可視化 - 知識グラフで解明するLLMsの内部メカニズム 言語モデルの"頭の中"を可視化 - 知識グラフで解明するLLMsの内部 ... 2024年09月03日 Computation and Language
モバイルUI向けマルチモーダル大規模言語モデル「Ferret-UI」 モバイルUI向けマルチモーダル大規模言語モデル「Ferret-UI」 2024年09月02日 Large language models
【BitNet b1.58】モデルパラメータを3値で表現しLlama以上の精度を達成!? 【BitNet b1.58】モデルパラメータを3値で表現しLlama以 ... 2024年08月27日 Large language models
超長いプロンプト文を圧縮してメモリを抑えるGoogleの高性能LLM 超長いプロンプト文を圧縮してメモリを抑えるGoogleの高性能LLM 2024年08月27日 Large language models
100kトークン以上の長文のみから構成された書籍要約のためのデータセット、FABLESが登場! 100kトークン以上の長文のみから構成された書籍要約のためのデータセッ ... 2024年08月23日 Large language models
LLMの協調行動と共有資源の管理能力を評価するためのプラットフォームが登場! LLMの協調行動と共有資源の管理能力を評価するためのプラットフォームが ... 2024年08月22日 Simulation Platform
DNA解析から遺伝子発現予測、大規模言語モデルによる生物情報学への応用 DNA解析から遺伝子発現予測、大規模言語モデルによる生物情報学への応用 2024年08月21日 Large language models