Trong bài báo này, chúng tôi trình bày bằng chứng cho thấy SLM vẫn có lợi thế về chất lượng đối với một số tác vụ miền yêu cầu đầu ra có cấu trúc, bất chấp sự xuất hiện của các mô hình ngôn ngữ quy mô lớn (LLM) như GPT-4 khiến lợi ích (suy luận nhanh hơn, chi phí thấp hơn) của việc tinh chỉnh các mô hình ngôn ngữ quy mô nhỏ (SLM) cho các ứng dụng thực tế trở nên kém rõ ràng hơn. Bằng cách so sánh tinh chỉnh SLM với nhắc nhở LLM trên một tác vụ tạo quy trình làm việc JSON mã thấp, chúng tôi nhận thấy rằng nhắc nhở tốt có thể mang lại kết quả hợp lý, nhưng tinh chỉnh chỉ cải thiện chất lượng trung bình 10%. Ngoài ra, chúng tôi cũng chỉ ra những hạn chế của mô hình thông qua phân tích lỗi hệ thống.