[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Một khuôn khổ đa giai đoạn với lý luận hướng dẫn phân loại để phân loại nghề nghiệp bằng cách sử dụng các mô hình ngôn ngữ lớn

Created by
  • Haebom

Tác giả

Palakorn Achananuparp, Ee-Peng Lim, Yao Lu

Phác thảo

Bài báo này tập trung vào nhiệm vụ phân loại nghề nghiệp, tự động chú thích dữ liệu công việc với các nghề nghiệp được chuẩn hóa trong phân loại học. Nhiệm vụ này bị cản trở bởi việc thiếu dữ liệu và khó khăn của việc chú thích thủ công. Nghiên cứu này chỉ ra rằng mặc dù các mô hình ngôn ngữ quy mô lớn (LLM) rất hứa hẹn nhờ kiến thức thế giới rộng lớn và khả năng học tập dựa trên ngữ cảnh, nhưng hiệu quả của chúng phụ thuộc vào kiến thức về phân loại học nghề nghiệp. Do đó, chúng tôi đánh giá khả năng của LLM trong việc tạo ra các thực thể phân loại chính xác, và đặc biệt nhấn mạnh những hạn chế của các mô hình quy mô nhỏ. Để giải quyết những vấn đề này, chúng tôi đề xuất một khuôn khổ đa giai đoạn bao gồm các giai đoạn suy luận, truy xuất và xếp hạng lại, tích hợp các ví dụ suy luận dựa trên phân loại và cải thiện hiệu suất thông qua việc liên kết với kiến thức phân loại. Kết quả đánh giá trên các tập dữ liệu quy mô lớn cho thấy khuôn khổ được đề xuất không chỉ cải thiện các nhiệm vụ phân loại nghề nghiệp và kỹ năng mà còn cung cấp một giải pháp thay thế tiết kiệm chi phí cho các mô hình tiên tiến như GPT-4o, giúp giảm đáng kể chi phí tính toán trong khi vẫn duy trì hiệu suất mạnh mẽ. Do đó, nghiên cứu này cung cấp một giải pháp thực tế và có thể mở rộng cho việc phân loại nghề nghiệp và các nhiệm vụ liên quan trong nhiều chương trình LLM khác nhau.

Takeaways, Limitations

Takeaways:
Đề Xuất phương pháp nâng cao hiệu quả và độ chính xác của phân loại nghề nghiệp bằng LLM.
Khung nhiều giai đoạn được đề xuất cung cấp giải pháp thay thế tiết kiệm chi phí cho các mô hình đắt tiền như GPT-4o.
Xác thực hiệu suất của khuôn khổ thông qua các thử nghiệm sử dụng bộ dữ liệu quy mô lớn.
Cung cấp các giải pháp có khả năng mở rộng áp dụng cho nhiều chương trình LLM khác nhau.
Limitations:
ĐốI với các LLM nhỏ, hiệu suất có thể bị suy giảm.
Hiệu suất của khuôn khổ đề xuất có thể phụ thuộc vào chất lượng của lược đồ phân loại được sử dụng.
Cần có thêm nghiên cứu về khả năng khái quát hóa cho các ngôn ngữ hoặc lĩnh vực nghề nghiệp cụ thể.
👍