Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Tác động của nhãn dán lên tình cảm và ý định đa phương thức trên mạng xã hội: Nhiệm vụ, tập dữ liệu và đường cơ sở mới

Created by
  • Haebom

Tác giả

Yuanchen Shi, Biao Ma, Long Âm Zhang, Fang Kong

Phác thảo

Trong bài báo này, chúng tôi trình bày một nhiệm vụ mới, Phân tích tình cảm và nhận dạng ý định trò chuyện đa phương thức liên quan đến nhãn dán (MSAIRS), để phân tích ảnh hưởng của nhãn dán, vốn ngày càng được sử dụng để thể hiện cảm xúc và ý định trên mạng xã hội. Chúng tôi giới thiệu một tập dữ liệu đa phương thức mới chứa các bản ghi trò chuyện và nhãn dán tiếng Trung, bao gồm nhiều nhãn dán với các nhãn dán khác nhau cho cùng một văn bản, các ngữ cảnh khác nhau cho cùng một nhãn dán và các văn bản khác nhau cho cùng một hình ảnh, để hiểu rõ hơn ảnh hưởng của nhãn dán đến cảm xúc và ý định trò chuyện. Ngoài ra, chúng tôi đề xuất một mô hình kết hợp đa phương thức hiệu quả, MMSAIR, với cấu trúc vectơ phân biệt và cơ chế chú ý theo tầng, cho thấy độ chính xác được cải thiện thông qua việc củng cố lẫn nhau cảm xúc và ý định. Kết quả thử nghiệm cho thấy MMSAIR vượt trội hơn các mô hình hiện có và MLLM tiên tiến, chứng minh thách thức và tính độc đáo của việc diễn giải nhãn dán trên mạng xã hội. Tập dữ liệu và mã nguồn được mở trên GitHub.

Takeaways, Limitations

_____T96806____:
Chúng tôi nhấn mạnh tầm quan trọng của nhãn dán trong phân tích tình cảm trên mạng xã hội và nghiên cứu nhận dạng ý định, đồng thời đề xuất các hướng nghiên cứu mới.
Chúng tôi đề xuất một tập dữ liệu và mô hình đa phương thức xem xét các khía cạnh khác nhau của nhãn dán (văn bản, hình ảnh và ngữ cảnh).
Chúng tôi chứng minh bằng thực nghiệm tính hiệu quả của mô hình chung có tính đến sự phụ thuộc lẫn nhau giữa cảm xúc và ý định.
Chúng tôi đóng góp vào sự phát triển của công nghệ phân tích cảm xúc và ý định dựa trên nhãn dán bằng cách giới thiệu mô hình MMSAIR vượt trội hơn các mô hình hiện có.
Các tập dữ liệu và mã có sẵn công khai cung cấp nền tảng cho nghiên cứu sâu hơn.
_____T96807____-:
Bộ dữ liệu hiện tại chỉ giới hạn ở dữ liệu mạng xã hội Trung Quốc. Cần nghiên cứu thêm để xác định khả năng khái quát hóa cho các ngôn ngữ và nền văn hóa khác.
Có thể cần nghiên cứu thêm để diễn giải ý nghĩa trực quan của nhãn dán. Các mô hình hiện tại có thể không nắm bắt đầy đủ các đặc điểm trực quan của hình ảnh.
Nó có thể không bao quát được tất cả các loại nhãn dán và các tình huống phức tạp trên mạng xã hội. Có thể cần một bộ dữ liệu đa dạng và phong phú hơn.
👍