Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Tác nhân AI cho thử nghiệm web: Một nghiên cứu điển hình trong thực tế

Created by
  • Haebom

Tác giả

Naimeng Ye, Xiao Yu, Ruize Xu, Tianyi Peng, Chu Du

Phác thảo

Bài báo này trình bày WebProber, một nền tảng kiểm thử web dựa trên các mô hình ngôn ngữ quy mô lớn (LLM) và các tác nhân AI, giúp xác định hiệu quả các vấn đề về khả năng sử dụng trên trang web. Không giống như các phương pháp hiện có tập trung vào độ bao phủ mã và kiểm thử tải, WebProber điều hướng và tương tác với các trang web theo cách tương tự như người dùng thực tế, xác định lỗi và các vấn đề về khả năng sử dụng, đồng thời tạo ra các báo cáo dễ đọc. Trong một nghiên cứu điển hình trên 120 trang web học thuật, WebProber đã xác định được 29 vấn đề về khả năng sử dụng mà các công cụ hiện có còn bỏ sót. Điều này chứng minh tiềm năng của kiểm thử dựa trên tác nhân AI và gợi ý các hướng phát triển cho các nền tảng kiểm thử lấy người dùng làm trung tâm thế hệ tiếp theo.

Takeaways, Limitations

_____T43056____:
Kiểm tra web dựa trên tác nhân AI có thể phát hiện các vấn đề về khả năng sử dụng hiệu quả hơn các phương pháp truyền thống.
WebProber mô phỏng hành vi của người dùng thực tế, cho phép thử nghiệm thực tế hơn.
Kiểm thử tự động có thể giảm thời gian và chi phí phát triển.
Nó đưa ra một hướng đi mới trong việc phát triển khuôn khổ thử nghiệm lấy người dùng làm trung tâm.
Limitations:
WebProber là bản mẫu và yêu cầu công nghệ và tính năng tiên tiến hơn.
Cần phải xác nhận thêm khả năng khái quát hóa trên nhiều môi trường trang web khác nhau.
Do hạn chế của tác nhân AI, chúng có thể không phát hiện được mọi vấn đề về khả năng sử dụng.
Quy mô nghiên cứu có hạn và cần nghiên cứu thêm về các loại trang web khác nhau.
👍