दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

नीति मानचित्र: एलएलएम व्यवहारों के असीम क्षेत्र को निर्देशित करने के लिए उपकरण

Created by
  • Haebom

लेखक

मिशेल एस. लैम, फ्रेड होहमैन, डोमिनिक मोरिट्ज़, जेफरी पी. बिगहम, केनेथ होल्स्टीन, मैरी बेथ केरी

रूपरेखा

यह शोधपत्र "नीति मानचित्र" प्रस्तुत करता है, जो बड़े पैमाने के भाषा मॉडलों (एलएलएम) के विशाल व्यवहारिक क्षेत्र में नीतियों को प्रभावी ढंग से डिज़ाइन करने का एक नया तरीका है। भौतिक मानचित्रण से प्रेरित, यह विधि सभी व्यवहारों को समाहित करने के बजाय, किन पहलुओं को समाहित करना है और किन पहलुओं को अमूर्त करना है, इस बारे में जानबूझकर डिज़ाइन विकल्पों के माध्यम से प्रभावी अन्वेषण की सुविधा प्रदान करती है। "नीति प्रोजेक्टर", एक इंटरैक्टिव उपकरण, उपयोगकर्ताओं को एलएलएम इनपुट-आउटपुट युग्मों के परिदृश्य का अन्वेषण करने, उपयोगकर्ता-परिभाषित क्षेत्रों (जैसे, "हिंसा") को परिभाषित करने, और सशर्त नीति नियमों का उपयोग करके इन क्षेत्रों का अन्वेषण करने की अनुमति देता है जिन्हें एलएलएम आउटपुट पर लागू किया जा सकता है (जैसे, यदि आउटपुट में "हिंसा" और "ग्राफ़िकल विवरण" शामिल हैं, तो "ग्राफ़िकल विवरण" के बिना पुनर्लेखन करें)। यह एलएलएम वर्गीकरण और संचालन क्षमताओं और मानचित्र विज़ुअलाइज़ेशन का समर्थन करता है जो एआई प्रैक्टिशनर्स के कार्य को दर्शाते हैं। 12 एआई सुरक्षा विशेषज्ञों के साथ किए गए मूल्यांकन समस्याग्रस्त मॉडल व्यवहारों, जैसे गलत लिंग धारणाओं और तत्काल शारीरिक सुरक्षा खतरों से निपटने के लिए नीतियाँ लिखने में इसकी प्रभावशीलता को प्रदर्शित करते हैं।

Takeaways, Limitations

Takeaways:
एलएलएम के विशाल कार्य क्षेत्र में प्रभावी नीति डिजाइन के लिए एक नया दृष्टिकोण प्रस्तुत करना।
इंटरैक्टिव उपकरण नीति-लेखन प्रक्रिया के लिए सहज और कुशल समर्थन प्रदान करते हैं।
एआई सुरक्षा विशेषज्ञ मूल्यांकन के माध्यम से व्यावहारिकता और प्रभावशीलता का सत्यापन
समस्याग्रस्त मॉडल व्यवहार के लिए नीति डिजाइन हेतु व्यावहारिक समाधान प्रदान करना।
Limitations:
नीति मानचित्रों के डिजाइन और निर्माण के लिए विशेषज्ञता की आवश्यकता
नीति प्रोजेक्टर उपकरणों की उपयोगिता और मापनीयता पर आगे अनुसंधान की आवश्यकता है।
विशेषज्ञ मूल्यांकनों की सीमित संख्या के कारण सामान्यीकरण की और पुष्टि की आवश्यकता है।
विभिन्न प्रकार के एलएलएम और उनके नीतिगत अनुप्रयोगों पर आगे अनुसंधान की आवश्यकता है।
👍