इस शोधपत्र में, हम BEARCUBS प्रस्तुत करते हैं, जो वास्तविक वेब परिवेशों में वेब एजेंटों की सूचना प्राप्ति क्षमता के मूल्यांकन हेतु एक नया मानक है। BEARCUBS में 111 सूचना प्राप्ति प्रश्न शामिल हैं, और मौजूदा मानकों के विपरीत, इसके लिए वास्तविक वेब पृष्ठों और विभिन्न इंटरमॉडल इंटरैक्शन (जैसे, वीडियो समझ, 3D नेविगेशन) की आवश्यकता होती है। मानव प्रयोग के परिणाम दर्शाते हैं कि प्रश्नों की कठिनाई उचित है (84.7% सटीकता), जबकि अत्याधुनिक वेब एजेंट कम सटीकता (23.4% तक) दिखाते हैं। यह विश्वसनीय सूचना स्रोतों और मजबूत मल्टीमॉडल क्षमताओं के चयन के महत्व पर बल देता है। वेब एजेंट अनुसंधान में योगदान देने के लिए BEARCUBS को निरंतर अद्यतन किया जाता रहेगा।