दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

HonestCyberEval: स्वचालित सॉफ़्टवेयर शोषण के लिए एक AI साइबर जोखिम बेंचमार्क

Created by
  • Haebom

लेखक

डैन रिस्टिया, वासिलियोस मावरौडिस

रूपरेखा

पेश है HonestCyberEval नामक एक नया बेंचमार्क। यह बेंचमार्क स्वचालित सॉफ़्टवेयर शोषण के विरुद्ध AI मॉडल की क्षमताओं और जोखिमों का आकलन करने के लिए डिज़ाइन किया गया है, जो वास्तविक दुनिया की सॉफ़्टवेयर प्रणालियों में कमज़ोरियों का पता लगाने और उनका दोहन करने की AI मॉडल की क्षमता पर केंद्रित है। सिंथेटिक कमज़ोरियों वाले Nginx वेब सर्वर रिपॉजिटरी का उपयोग करते हुए, हमने कई प्रमुख भाषा मॉडलों का मूल्यांकन किया, जिनमें OpenAI का GPT-4.5, o3-mini, o1, और o1-mini; Anthropic का Claude-3-7-sonnet-20250219, Claude-3.5-sonnet-20241022, और Claude-3.5-sonnet-20240620; Google DeepMind का Gemini-1.5-pro; और OpenAI का पिछला GPT-4o मॉडल शामिल हैं। परिणाम इन मॉडलों की सफलता दर और प्रभावशीलता में महत्वपूर्ण अंतर दर्शाते हैं। o1-preview ने सबसे ज़्यादा सफलता दर (92.85%) हासिल की, जबकि o3-mini और Claude-3.7-sonnet-20250219 ने किफ़ायती लेकिन कम सफलता दर वाले विकल्प पेश किए। यह जोखिम मूल्यांकन वास्तविक साइबर हमलों से निपटने में AI साइबर जोखिमों के व्यवस्थित आकलन के लिए एक आधार प्रदान करता है।

Takeaways, Limitations

_____टी20_____:
हम HonestCyberEval प्रस्तुत करते हैं, जो एक नया बेंचमार्क है जो वास्तविक दुनिया की सॉफ्टवेयर प्रणालियों में कमजोरियों का फायदा उठाने के लिए AI मॉडल की क्षमता का मूल्यांकन करता है।
विभिन्न अत्याधुनिक भाषा मॉडलों की स्वचालित सॉफ्टवेयर शोषण क्षमताओं की तुलना और विश्लेषण प्रदान करता है।
मॉडल की सफलता दर और लागत-प्रभावशीलता के बीच सहसंबंध का विश्लेषण करके इष्टतम मॉडल चयन में अंतर्दृष्टि प्रदान करता है।
यथार्थवादी साइबर हमले परिदृश्यों में एआई साइबर जोखिम मूल्यांकन के लिए एक व्यवस्थित ढांचा स्थापित करना।
_____टी21_____:
मूल्यांकन Nginx वेब सर्वर और सिंथेटिक कमजोरियों तक सीमित है, इसलिए अन्य सॉफ्टवेयर प्रणालियों या वास्तविक दुनिया की कमजोरियों के लिए सामान्यीकरण सीमित है।
मूल्यांकन में प्रयुक्त भाषा मॉडल के प्रकार और संस्करण सीमित हो सकते हैं। मॉडलों की एक विस्तृत श्रृंखला का आगे मूल्यांकन आवश्यक है।
कृत्रिम कमजोरियों की वास्तविकता तथा उनके और वास्तविक कमजोरियों के बीच अंतर पर विचार किए जाने की आवश्यकता है।
👍