[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

MacOSWorld: Điểm chuẩn tương tác đa ngôn ngữ cho các tác nhân GUI

Created by
  • Haebom

Tác giả

Pei Yang, Hai Ci, Mike Zheng Shou

Phác thảo

MacOSWorld là công cụ đánh giá toàn diện đầu tiên để đánh giá các tác nhân GUI trong môi trường macOS. Công cụ này có 202 tác vụ tương tác đa ngôn ngữ bằng 5 ngôn ngữ (tiếng Anh, tiếng Trung, tiếng Ả Rập, tiếng Nhật và tiếng Nga) trên 30 ứng dụng (28 trong số đó dành riêng cho macOS). Công cụ này khắc phục những hạn chế của các công cụ đánh giá hiện có (tập trung vào tiếng Anh, dành riêng cho hệ điều hành) và bao gồm các mẫu và ứng dụng GUI độc đáo trong macOS. Công cụ này cũng bao gồm một tập hợp con điểm chuẩn an toàn để tính đến lỗ hổng của các tác nhân GUI trước các cuộc tấn công lừa đảo. Việc đánh giá sáu tác nhân GUI cho thấy các tác nhân dựa trên máy tính độc quyền có tỷ lệ thành công trên 30%, trong khi các mô hình nghiên cứu nhẹ nguồn mở có tỷ lệ thành công dưới 5%, làm nổi bật nhu cầu điều chỉnh miền macOS. Các điểm chuẩn đa ngôn ngữ cho thấy những điểm yếu chung, đặc biệt là tiếng Ả Rập, với mức giảm hiệu suất trung bình là 28,8% so với tiếng Anh. Kết quả điểm chuẩn an toàn cho thấy các cuộc tấn công lừa đảo phổ biến hơn và cần được xử lý ngay lập tức. macOSWorld có sẵn tại https://github.com/showlab/macosworld .

Takeaways, Limitations

Takeaways:
Cung cấp chuẩn mực toàn diện đầu tiên để đánh giá hiệu suất của tác nhân GUI trong môi trường macOS.
Khắc phục những hạn chế của các chuẩn mực hiện tại với các ứng dụng chỉ dành cho macOS và hỗ trợ đa ngôn ngữ.
Chúng tôi trình bày kết quả đánh giá an toàn cho thấy mức độ dễ bị tấn công lừa đảo của tác nhân GUI.
Nhấn mạnh tầm quan trọng của việc điều chỉnh miền macOS thông qua sự khác biệt về hiệu suất giữa các mô hình nguồn mở và độc quyền.
Phân tích sự khác biệt về hiệu suất theo ngôn ngữ và đề xuất cải tiến thông qua hỗ trợ đa ngôn ngữ.
Limitations:
Các loại tác nhân GUI hiện có trong chuẩn mực có thể bị hạn chế.
Có thể cần phải đánh giá nhiều loại tấn công lừa dối khác nhau.
MacOSWorld được tối ưu hóa cho môi trường cụ thể của macOS, do đó khả năng áp dụng cho các môi trường hệ điều hành khác có thể bị hạn chế.
Có thể thiếu mô tả chi tiết về loại và đặc điểm của tác nhân GUI được sử dụng trong quá trình đánh giá.
👍