最新AI論文をキャッチアップ

LLMでドメイン汎化のための学習データを作る

LLMでドメイン汎化のための学習データを作る

Dataset Synthesis with LLM

3つの要点

✔️ NLIタスクのドメイン汎化性能を向上させるために、LLMを用いた合成データ生成手法を提案。
✔️ 提案した方法により生成した合成データを学習に用いた場合、特にモデルサイズが小さい(高速な推論が重要な)場合に有効。
✔️ さらに、十分大きなモデルに対して合成データを学習させることで分布内性能を改善することも示した。

A Synthetic Data Approach for Domain Generalization of NLI Models
written by Mohammad Javad HosseiniAndrey PetrovAlex FabrikantAnnie Louis
(Submitted on 19 Feb 2024 (v1), last revised 28 Jun 2024 (this version, v2))

Subjects:
Computation and Language (cs.CL)

code:

 

続きを読むには

(5136文字画像10枚)

AI-SCHOLARに
登録いただく必要があります。

1分で無料で簡単登録する

または
  • メルマガ登録(ver
  • ライター
  • エンジニア_大募集!!

記事の内容等について改善箇所などございましたら、
お問い合わせフォームよりAI-SCHOLAR編集部の方にご連絡を頂けますと幸いです。
どうぞよろしくお願いします。

お問い合わせする