Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới. Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận. Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.
MacOSWorld: Điểm chuẩn tương tác đa ngôn ngữ cho các tác nhân GUI
Created by
Haebom
Tác giả
Pei Yang, Hai Ci, Mike Zheng Shou
Phác thảo
MacOSWorld là công cụ đánh giá toàn diện đầu tiên để đánh giá các tác nhân GUI trong môi trường macOS. Công cụ này có 202 tác vụ tương tác đa ngôn ngữ bằng 5 ngôn ngữ (tiếng Anh, tiếng Trung, tiếng Ả Rập, tiếng Nhật và tiếng Nga) trên 30 ứng dụng (28 trong số đó dành riêng cho macOS). Công cụ này khắc phục những hạn chế của các công cụ đánh giá hiện có (tập trung vào tiếng Anh, dành riêng cho hệ điều hành) và bao gồm các mẫu và ứng dụng GUI độc đáo trong macOS. Công cụ này cũng bao gồm một tập hợp con điểm chuẩn an toàn để tính đến lỗ hổng của các tác nhân GUI trước các cuộc tấn công lừa đảo. Việc đánh giá sáu tác nhân GUI cho thấy các tác nhân dựa trên máy tính độc quyền có tỷ lệ thành công trên 30%, trong khi các mô hình nghiên cứu nhẹ nguồn mở có tỷ lệ thành công dưới 5%, làm nổi bật nhu cầu điều chỉnh miền macOS. Các điểm chuẩn đa ngôn ngữ cho thấy những điểm yếu chung, đặc biệt là tiếng Ả Rập, với mức giảm hiệu suất trung bình là 28,8% so với tiếng Anh. Kết quả điểm chuẩn an toàn cho thấy các cuộc tấn công lừa đảo phổ biến hơn và cần được xử lý ngay lập tức. macOSWorld có sẵn tại https://github.com/showlab/macosworld .