结合多样性和任务专业化的 LLM 学习：TCIA 机制和实验结果

20/09/2025

三个要点
✔️ TCIA 是一个指令扩展框架，兼具通用性和任务一致性
✔️ 将指令分解为基本查询和约束，并通过 BFS 搜索生成多样化指令
✔️ 实验表明，平均性能提高了 8.7%，性能也优于 GPT-4o

TCIA: A Task-Centric Instruction Augmentation Method for Instruction Finetuning
written by Simin Ma, Shujian Liu, Jun Tan, Yebowen Hu, Song Wang, Sathish Reddy Indurthi, Sanqiang Zhao, Liwei Wu, Jianbing Han, Kaiqiang Song
(Submitted on 28 Aug 2025)
Comments: Published on arxiv.
Subjects: Artificial Intelligence (cs.AI)

本文所使用的图片要么来自论文、介绍性幻灯片，要么是参考这些图片制作的。

摘要

本文提出了一种以任务为中心的指令数据增强方法，称为任务中心指令增强（TCIA），用于 LLM 微调，该方法符合实际应用。

传统方法试图通过自生成指令数据增强来确保多样性，但存在重复指令和 "任务漂移 "的问题，这会导致偏离目标任务。
在现实世界中，有许多情况下需要的是专门针对特定任务的性能，而不是通用模型，因此必须有一种机制来保持任务的适用性和多样性。

TCIA 是一种将自然语言指令分解为 "基本问题 "和 "限制条件 "组合的方法，并在处理限制条件的同时广泛扩展指令。
实验表明，在会议总结等实际任务中，平均性能提高了 8.7%，在某些情况下甚至超过了 GPT-4o。
通过这种方式，TCIA 为 LLM 调整提供了一个新的框架，该框架对现实应用具有鲁棒性。