【GenAI-Arena】ユーザー投票で生成モデルを評価する新プラットフォーム 【GenAI-Arena】ユーザー投票で生成モデルを評価する新プラット ... 2024年12月20日 Large language models
【SKETCHPAD】マルチモーダル言語モデルの推論を中間スケッチで強化 【SKETCHPAD】マルチモーダル言語モデルの推論を中間スケッチで強 ... 2024年12月18日 Large language models
【Plot2Code】マルチモーダルLLMのコード生成をテストするベンチマーク 【Plot2Code】マルチモーダルLLMのコード生成をテストするベン ... 2024年12月17日 Large language models
LLMを活用したユーザー主導の文章改善ツール「Textfocals」 LLMを活用したユーザー主導の文章改善ツール「Textfocals」 2024年12月13日 Large language models
科学的自然言語推論のための多様なベンチマーク「MSciNLI」の提案 科学的自然言語推論のための多様なベンチマーク「MSciNLI」の提案 2024年12月12日 Large language models
大規模データセットSMolInstructで化学LLM「LlaSMol」を開発 大規模データセットSMolInstructで化学LLM「LlaSMol ... 2024年12月02日 Large language models
【ChemReasoner】量子化学とLLMを活用した触媒発見フレームワーク 【ChemReasoner】量子化学とLLMを活用した触媒発見フレーム ... 2024年11月29日 Large language models
【SciAssess】LLMの「科学文献の分析性能」を評価するベンチマーク 【SciAssess】LLMの「科学文献の分析性能」を評価するベンチマ ... 2024年11月28日 Large language models
【ChemBench】新しい化学分野のベンチマーク!LLMが専門家を超えた? 【ChemBench】新しい化学分野のベンチマーク!LLMが専門家を超 ... 2024年11月26日 Large language models
【RiceChem】LLMによる自動長文採点(ALAG)を評価するデータセット 【RiceChem】LLMによる自動長文採点(ALAG)を評価するデー ... 2024年11月26日 Large language models
【DrugLLM】大規模言語モデルを活用したFew-Shotによる分子生成 【DrugLLM】大規模言語モデルを活用したFew-Shotによる分子 ... 2024年11月19日 Large language models