दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

टूल-संवर्धित एलएलएम के लिए टूल अनलर्निंग

Created by
  • Haebom

लेखक

जियाली चेंग, हादी अमीरी

रूपरेखा

यह शोधपत्र एक नई चुनौती प्रस्तुत करता है: "टूल अनलर्निंग", जो टूल-आधारित एलएलएम से विशिष्ट टूल्स के बारे में सीख को हटा देता है। पारंपरिक अनलर्निंग के विपरीत, इस दृष्टिकोण में व्यक्तिगत नमूनों के बजाय स्वयं ज्ञान को हटाना आवश्यक है। यह दृष्टिकोण चुनौतियों को प्रस्तुत करता है, जिनमें एलएलएम अनुकूलन की उच्च लागत और एक सैद्धांतिक मूल्यांकन मीट्रिक की आवश्यकता शामिल है। इन चुनौतियों का समाधान करने के लिए, हम टूलडिलीट का प्रस्ताव करते हैं, जो टूल-आधारित एलएलएम में टूल्स को प्रभावी ढंग से अनलर्न करने का पहला तरीका है। टूलडिलीट प्रभावी टूल अनलर्निंग के लिए तीन प्रमुख गुणों को लागू करता है और प्रभावी मूल्यांकन के लिए एक नया सदस्यता अनुमान आक्रमण (एमआईए) मॉडल प्रस्तुत करता है। विभिन्न टूल-प्रशिक्षण डेटासेट और टूल-आधारित एलएलएम पर व्यापक प्रयोग प्रदर्शित करते हैं कि टूलडिलीट यादृच्छिक रूप से चयनित टूल्स को प्रभावी ढंग से अनलर्न करता है, जबकि शेष टूल्स के बारे में एलएलएम के ज्ञान और सामान्य कार्यों पर उसके प्रदर्शन को संरक्षित रखता है।

Takeaways, Limitations

Takeaways:
हम टूल-आधारित एलएलएम में टूल अनलर्निंग नामक एक नई चुनौती को परिभाषित करते हैं और इसके लिए एक प्रभावी विधि, टूलडिलीट प्रस्तुत करते हैं।
प्रयोगात्मक रूप से यह सिद्ध हो चुका है कि सुरक्षा कमजोरियों, गोपनीयता विनियमों या उपकरण अवमूल्यन के कारण विशिष्ट उपकरणों से सीख को हटाने में टूलडिलीट प्रभावी है।
टूल अनलर्निंग की प्रभावशीलता को मापने के लिए एक नई मूल्यांकन पद्धति को नए MIA मॉडल के माध्यम से प्रस्तुत किया गया है।
Limitations:
टूलडिलीट का निष्पादन मूल्यांकन प्रस्तावित एमआईए मॉडल पर निर्भर है और इसे अन्य मूल्यांकन मेट्रिक्स के माध्यम से सत्यापित करने की आवश्यकता है।
यद्यपि हम विभिन्न उपकरणों और डेटासेट पर प्रयोगात्मक परिणाम प्रस्तुत करते हैं, फिर भी वास्तविक दुनिया के वातावरण में सामान्यीकरण प्रदर्शन पर और अधिक शोध की आवश्यकता है।
टूल अनलर्निंग के दौरान एलएलएम के संभावित समग्र प्रदर्शन ह्रास को निर्धारित करने के लिए आगे के विश्लेषण की आवश्यकता है।
👍