Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

MMBERT: Hỗn hợp chuyên gia đa phương thức BERT được chia tỷ lệ để phát hiện ngôn từ kích động thù địch của Trung Quốc mạnh mẽ dưới nhiễu loạn che giấu

Created by
  • Haebom

Tác giả

Qiyao Xue, Yuchen Dou, Ryan Shi, Xiang Lorraine Li, Wei Gao

Phác thảo

Bài báo này đề cập đến thách thức trong việc phát hiện ngôn từ kích động thù địch bằng tiếng Trung, vốn đang bị thách thức bởi sự phổ biến ngày càng tăng của các kỹ thuật ngụy trang trên mạng xã hội Trung Quốc. Việc sử dụng rộng rãi các kỹ thuật ngụy trang để vượt qua các hệ thống phát hiện dựa trên văn bản hiện có càng làm trầm trọng thêm thách thức này. Để giải quyết vấn đề này, bài báo đề xuất MMBERT, một khuôn khổ đa phương thức mới dựa trên BERT, tích hợp các phương thức văn bản, lời nói và hình ảnh thông qua kiến trúc Hỗn hợp Chuyên gia (MoE). Để giải quyết sự bất ổn liên quan đến việc tích hợp trực tiếp MoE vào các mô hình dựa trên BERT, bài báo này phát triển một mô hình đào tạo tiến bộ ba giai đoạn. MMBERT tăng cường khả năng chống lại các nhiễu loạn đối kháng bằng cách kết hợp các chuyên gia cụ thể theo từng phương thức, cơ chế tự chú ý chung và chiến lược phân công chuyên gia dựa trên bộ định tuyến. Kết quả thử nghiệm trên nhiều tập dữ liệu ngôn từ kích động thù địch của Trung Quốc chứng minh rằng MMBERT vượt trội đáng kể so với mô hình mã hóa dựa trên BERT được tinh chỉnh, các LLM được tinh chỉnh và các LLM sử dụng phương pháp học dựa trên ngữ cảnh.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một khuôn khổ đa phương thức mới (MMBERT) giúp cải thiện đáng kể hiệu suất phát hiện ngôn từ kích động thù địch trên các mạng xã hội Trung Quốc.
Cải thiện tính ổn định của các mô hình dựa trên BERT và đảm bảo tính mạnh mẽ trước các cuộc tấn công đối nghịch thông qua kiến trúc MoE và mô hình đào tạo tiến bộ ba giai đoạn.
Cải thiện hiệu suất phát hiện ngôn từ kích động thù địch toàn diện bằng cách tích hợp nhiều phương thức (văn bản, giọng nói và hình ảnh).
Thể hiện hiệu suất vượt trội so với các phương pháp hiện có dựa trên LLM đơn hoặc đơn phương thức.
_____T27886____:
ĐáNh giá hiệu suất của MMBERT chỉ giới hạn ở một tập dữ liệu cụ thể của Trung Quốc, cần nghiên cứu thêm về khả năng khái quát hóa của nó.
Có khả năng tăng thời gian đào tạo và tiêu thụ tài nguyên do tính phức tạp của mô hình đào tạo tiến bộ ba giai đoạn.
Cần có thêm các thí nghiệm và phân tích để xác định hiệu suất tổng quát của MMBERT so với nhiều kỹ thuật ngụy trang khác nhau.
Cần phải xác thực khả năng mở rộng sang các ngôn ngữ khác hoặc các nền tảng truyền thông xã hội khác.
👍