Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Tự động phát hiện các mẫu lừa đảo trực tuyến

Created by
  • Haebom

Tác giả

Asmit Nayak, Shirley Zhang, Yash Wani, Rishabh Khandelwal, Kassem Fawaz

Phác thảo

Bài báo này trình bày khung công tác AutoBot, tự động xác định và giảm thiểu các mẫu lừa đảo trong giao diện kỹ thuật số. AutoBot phân tích ảnh chụp màn hình trang web để xác định và định vị chính xác các mẫu lừa đảo mà không cần mã HTML. Một quy trình hai giai đoạn sử dụng các mô hình thị giác chuyên biệt và các mô hình ngôn ngữ quy mô lớn (LLM) sẽ phân tích các đặc điểm hình ảnh và văn bản của trang web để xác định các mẫu lừa đảo. Hơn nữa, AutoBot được sử dụng để huấn luyện các mô hình ngôn ngữ nhỏ hơn bằng cách trích xuất kiến ​​thức từ một LLM "giáo viên", tạo ra một tập dữ liệu tổng hợp. AutoBot được triển khai dưới dạng ba ứng dụng phụ: tiện ích mở rộng trình duyệt cho người dùng, công cụ kiểm tra Lighthouse cho nhà phát triển và công cụ đo lường cho các nhà nghiên cứu và cơ quan quản lý, hỗ trợ nhiều bên liên quan đến web. Kết quả đánh giá chứng minh tính hiệu quả của nó, đạt điểm F1 là 0,93 cho khả năng phát hiện mẫu lừa đảo.

Takeaways, Limitations

Takeaways:
Giới thiệu một khuôn khổ mới (AutoBot) có thể xác định và giảm thiểu hiệu quả các mẫu lừa đảo trên trang web.
Có thể phân tích chỉ bằng cách sử dụng ảnh chụp màn hình mà không cần dựa vào mã HTML.
Cung cấp ứng dụng cho nhiều bên liên quan, bao gồm người dùng, nhà phát triển, nhà nghiên cứu và cơ quan quản lý.
ĐạT độ chính xác cao (điểm F1 0,93).
Trình bày phương pháp tạo tập dữ liệu tổng hợp bằng LLM.
Limitations:
Chỉ trình bày kết quả đánh giá hiệu suất cho một loại mẫu lừa đảo cụ thể; cần xác minh hiệu suất tổng quát cho nhiều loại mẫu lừa đảo khác nhau.
Phân tích dựa trên ảnh chụp màn hình có thể có những hạn chế trong việc phản hồi các thay đổi của thành phần web động.
Độ Lệch và khả năng xảy ra lỗi do phụ thuộc vào hiệu suất của LLM.
ĐáNh giá không đầy đủ về khả năng thích ứng với những thay đổi trong mô hình lừa dối dài hạn.
👍