Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Sarc7: Đánh giá việc phát hiện và tạo ra sự mỉa mai với bảy loại và các kỹ thuật dựa trên cảm xúc

Created by
  • Haebom

Tác giả

Lang Xiong, Raina Gao, Alyssa Jeong, Yichen Fu, Sean O'Brien, Vasu Sharma, Kevin Zhu

Phác thảo

Bài báo này tập trung vào việc phân loại và tạo ra lời mỉa mai bằng cách sử dụng các mô hình ngôn ngữ quy mô lớn. Để giải quyết những thách thức của việc phát hiện lời mỉa mai hiện có, chúng tôi trình bày chuẩn Sarc7, phân loại bảy loại lời mỉa mai: tự hạ thấp, u ám, trung lập, lịch sự, khó chịu, giận dữ và hưng cảm, dựa trên tập dữ liệu MUStARD. Chúng tôi đánh giá hiệu suất phân loại bằng cách sử dụng zero-shot, few-shot, Chain of Thought (CoT) và một kỹ thuật gợi ý dựa trên cảm xúc mới. Sau đó, chúng tôi đề xuất một phương pháp tạo ra lời mỉa mai dựa trên cảm xúc bằng cách xác định các yếu tố chính của lời mỉa mai—sự bất nhất, sự sốc và sự phụ thuộc vào ngữ cảnh. Kết quả thử nghiệm cho thấy mô hình Gemini 2.5 đạt điểm F1 là 0,3664 khi sử dụng lời gợi ý dựa trên cảm xúc, vượt trội hơn các thiết lập khác. Những người đánh giá là con người đánh giá lời gợi ý dựa trên cảm xúc thành công hơn 38,46% trong việc tạo ra lời mỉa mai so với lời gợi ý không cần thực hiện.

Takeaways, Limitations

_____T140056____:
ĐóNg góp vào nghiên cứu phát hiện sự mỉa mai bằng cách đề xuất một chuẩn mực mới, Sarc7, phân loại bảy loại mỉa mai.
Chúng tôi trình bày khả năng cải thiện hiệu suất phân loại và tạo ra lời mỉa mai của các mô hình ngôn ngữ quy mô lớn bằng cách sử dụng các kỹ thuật gợi ý dựa trên cảm xúc.
Hiệu quả của việc thúc đẩy dựa trên cảm xúc đã được xác minh thông qua kết quả thử nghiệm sử dụng mô hình Gemini 2.5.
Limitations:
ĐIểm F1 là 0,3664 vẫn còn thấp, ngay cả khi xét đến độ khó cao của bài toán phân loại châm biếm. Cần nghiên cứu thêm để đạt được hiệu suất cao hơn.
Cần phải xác nhận thêm hiệu suất tổng quát của việc thúc đẩy dựa trên cảm xúc.
Có sự phụ thuộc vào một mô hình cụ thể (Gemini 2.5) và cần có kết quả thử nghiệm cho các mô hình khác.
Do phụ thuộc vào tập dữ liệu MUStARD nên cần phải xác thực hiệu suất trên các tập dữ liệu khác.
👍