Bài báo này trình bày TAGAL, một phương pháp mới để tạo dữ liệu bảng tổng hợp bằng cách sử dụng các mô hình ngôn ngữ quy mô lớn (LLM). TAGAL tự động hóa quy trình phản hồi lặp lại thông qua quy trình làm việc dựa trên tác nhân để cải thiện chất lượng dữ liệu mà không cần đào tạo LLM bổ sung. LLM cho phép tích hợp kiến thức bên ngoài vào quy trình tạo dữ liệu và chúng tôi đánh giá hiệu suất của TAGAL trên nhiều tập dữ liệu và khía cạnh chất lượng khác nhau. Chúng tôi phân tích tiện ích của các mô hình ML hạ lưu bằng cách đào tạo các bộ phân loại chỉ trên dữ liệu tổng hợp hoặc bằng cách kết hợp dữ liệu thực và dữ liệu tổng hợp, đồng thời so sánh sự tương đồng giữa dữ liệu thực và dữ liệu được tạo. Do đó, TAGAL chứng minh hiệu suất tương đương với các kỹ thuật tiên tiến yêu cầu đào tạo LLM và vượt trội hơn các kỹ thuật khác không yêu cầu đào tạo. Điều này làm nổi bật tiềm năng của quy trình làm việc dựa trên tác nhân và gợi ý những hướng đi mới cho việc tạo dữ liệu dựa trên LLM.