【BitNet b1.58】モデルパラメータを3値で表現しLlama以上の精度を達成!? 【BitNet b1.58】モデルパラメータを3値で表現しLlama以 ... 2024年08月27日 Large language models
超長いプロンプト文を圧縮してメモリを抑えるGoogleの高性能LLM 超長いプロンプト文を圧縮してメモリを抑えるGoogleの高性能LLM 2024年08月27日 Large language models
【IGModel】GNN+Attention機構を応用した手法が創薬における実用性の向上 【IGModel】GNN+Attention機構を応用した手法が創薬に ... 2024年07月28日 medical
ゲーム用LMベースエージェント(LMA)のアーキテクチャのレビューと課題 ゲーム用LMベースエージェント(LMA)のアーキテクチャのレビューと課 ... 2024年06月19日 Large language models
集団における文化的進化をLLMでシミュレートするためのフレームワークが登場! 集団における文化的進化をLLMでシミュレートするためのフレームワークが ... 2024年05月27日 Cultural evolution
「BioinspiredLLM」大規模言語モデルを活用した生物学的材料研究の革新 「BioinspiredLLM」大規模言語モデルを活用した生物学的材料 ... 2024年05月24日 Large language models
LLMが「心の理論」を有しているかを評価するベンチマーク、OpenToMが登場! LLMが「心の理論」を有しているかを評価するベンチマーク、OpenTo ... 2024年05月24日 Datasets
医療分野への新たなアプローチ、医療分野に特化した大規模言語モデル「BioMistral 7B」 医療分野への新たなアプローチ、医療分野に特化した大規模言語モデル「Bi ... 2024年05月24日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
Metaがツールの使い方を覚える言語モデルToolformerを開発 Metaがツールの使い方を覚える言語モデルToolformerを開発 2024年02月28日 Large language models