Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Phân tích so sánh các mô hình máy biến áp trong phân loại tweet thiên tai vì an toàn công cộng

Created by
  • Haebom

Tác giả

Sharif Noor Zisad, NM Istiak Chowdhury, Ragib Hasan

Phác thảo

Bài báo này khám phá việc phân loại tự động các tweet liên quan đến thảm họa trên các nền tảng mạng xã hội như Twitter, một nguồn thông tin thời gian thực quan trọng trong các trường hợp khẩn cấp về thảm họa và an toàn công cộng. Trong khi các mô hình học máy thông thường, chẳng hạn như hồi quy logistic, Bayes ngây thơ và máy vectơ hỗ trợ, gặp khó khăn trong việc hiểu ngữ cảnh hoặc ý nghĩa sâu xa của ngôn ngữ không chính thức, ẩn dụ hoặc mơ hồ, chúng tôi đưa ra giả thuyết và xác thực bằng thực nghiệm rằng các mô hình dựa trên Transformer (BERT, DistilBERT, RoBERTa và DeBERTa) sẽ hoạt động tốt hơn. Kết quả thực nghiệm chứng minh rằng BERT vượt trội đáng kể so với các mô hình thông thường (hồi quy logistic và Bayes ngây thơ, 82%) với độ chính xác 91%, thể hiện khả năng hiểu ngôn ngữ sắc thái tốt hơn thông qua các cơ chế nhúng ngữ cảnh và chú ý. Do đó, chúng tôi chứng minh rằng kiến ​​trúc Transformer phù hợp hơn cho các ứng dụng an toàn công cộng, mang lại độ chính xác được cải thiện, hiểu ngôn ngữ sâu hơn và khái quát hóa tốt hơn cho các văn bản truyền thông xã hội trong thế giới thực.

Takeaways, Limitations

Takeaways:
Chúng tôi chứng minh rằng mô hình dựa trên Transformer đạt được độ chính xác cao hơn đáng kể so với các mô hình học máy hiện có trong việc phân loại các tweet liên quan đến thảm họa.
Chúng tôi chứng minh rằng cơ chế nhúng ngữ cảnh và chú ý của mô hình Transformer có hiệu quả trong việc hiểu ngôn ngữ truyền thông xã hội không chính thức và mơ hồ.
Nghiên cứu này cho thấy tiềm năng của các mô hình dựa trên máy biến áp trong lĩnh vực an toàn công cộng và cho thấy chúng có thể góp phần ứng phó thảm họa hiệu quả.
Limitations:
Việc tập trung vào đánh giá hiệu suất của một mô hình máy biến áp cụ thể (BERT) có thể thiếu phân tích so sánh chi tiết giữa các mô hình khác.
Cần phải xác nhận thêm về hiệu suất thời gian thực và khả năng mở rộng trong các tình huống thảm họa thực tế.
Cần nghiên cứu thêm để xác định khả năng khái quát trên nhiều nền tảng ngôn ngữ và văn hóa khác nhau.
👍