Trong bài báo này, chúng tôi trình bày BEARCUBS, một chuẩn mực mới để đánh giá khả năng tìm kiếm thông tin của các tác nhân web trong môi trường web thực tế. BEARCUBS bao gồm 111 câu hỏi tìm kiếm thông tin, và không giống như các chuẩn mực hiện có, nó yêu cầu các trang web thực tế và nhiều tương tác đa phương thức (ví dụ: hiểu video, điều hướng 3D). Kết quả thử nghiệm trên người cho thấy độ khó của các câu hỏi là phù hợp (độ chính xác 84,7%), trong khi các tác nhân web hiện đại cho thấy độ chính xác thấp (lên đến 23,4%). Điều này nhấn mạnh tầm quan trọng của việc lựa chọn các nguồn thông tin đáng tin cậy và khả năng đa phương thức mạnh mẽ. BEARCUBS sẽ tiếp tục được cập nhật để đóng góp cho nghiên cứu về tác nhân web.