Bài báo này tập trung vào nhiệm vụ phân loại nghề nghiệp, tự động chú thích dữ liệu công việc với các nghề nghiệp được chuẩn hóa trong phân loại học. Nhiệm vụ này bị cản trở bởi việc thiếu dữ liệu và khó khăn của việc chú thích thủ công. Nghiên cứu này chỉ ra rằng mặc dù các mô hình ngôn ngữ quy mô lớn (LLM) rất hứa hẹn nhờ kiến thức thế giới rộng lớn và khả năng học tập dựa trên ngữ cảnh, nhưng hiệu quả của chúng phụ thuộc vào kiến thức về phân loại học nghề nghiệp. Do đó, chúng tôi đánh giá khả năng của LLM trong việc tạo ra các thực thể phân loại chính xác, và đặc biệt nhấn mạnh những hạn chế của các mô hình quy mô nhỏ. Để giải quyết những vấn đề này, chúng tôi đề xuất một khuôn khổ đa giai đoạn bao gồm các giai đoạn suy luận, truy xuất và xếp hạng lại, tích hợp các ví dụ suy luận dựa trên phân loại và cải thiện hiệu suất thông qua việc liên kết với kiến thức phân loại. Kết quả đánh giá trên các tập dữ liệu quy mô lớn cho thấy khuôn khổ được đề xuất không chỉ cải thiện các nhiệm vụ phân loại nghề nghiệp và kỹ năng mà còn cung cấp một giải pháp thay thế tiết kiệm chi phí cho các mô hình tiên tiến như GPT-4o, giúp giảm đáng kể chi phí tính toán trong khi vẫn duy trì hiệu suất mạnh mẽ. Do đó, nghiên cứu này cung cấp một giải pháp thực tế và có thể mở rộng cho việc phân loại nghề nghiệp và các nhiệm vụ liên quan trong nhiều chương trình LLM khác nhau.