दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

शफल गोपनीयता मॉडल के माध्यम से सुरक्षित सुदृढीकरण सीखना

Created by
  • Haebom

लेखक

शाओजी बाई, मोहम्मद सादेघ तालेबी, चेंगचेंग झाओ, पेंग चेंग, जिमिंग चेन

रूपरेखा

यह शोधपत्र सुदृढीकरण अधिगम (आर.एल.) में गोपनीयता संबंधी मुद्दों, विशेष रूप से साइबर-भौतिक प्रणालियों (सी.पी.एस.) में गोपनीयता अनुमान हमलों के जोखिम पर केंद्रित है। मौजूदा केंद्रीकृत विभेदक गोपनीयता (डी.पी.) मॉडल विश्वसनीय सर्वरों पर निर्भर करते हैं, जबकि वितरित स्थानीय मॉडल गंभीर प्रदर्शन ह्रास से ग्रस्त हैं। इसलिए, यह शोधपत्र एपिसोडिक आर.एल., शफल विभेदक गोपनीयता नीति उन्मूलन (एस.डी.पी.-पी.ई.) के लिए एक नवीन एल्गोरिथ्म प्रस्तावित करता है, जो शफल मॉडल, एक मध्यवर्ती विश्वास मॉडल, का उपयोग करता है। एस.डी.पी.-पी.ई. एक घातांकीय बैच शेड्यूल और एक "भूल" तंत्र को लागू करके गोपनीयता और अधिगम प्रदर्शन को संतुलित करता है, एक लगभग इष्टतम पछतावे की ऊपरी सीमा प्राप्त करता है और स्थानीय मॉडलों की तुलना में बेहतर गोपनीयता-पछतावे का संतुलन प्रदान करता है। यह सुरक्षित डेटा-संचालित सी.पी.एस. नियंत्रण के लिए शफल मॉडल की प्रयोज्यता को प्रदर्शित करता है।

Takeaways, Limitations

Takeaways:
हम एक सुदृढीकरण सीखने के एल्गोरिदम, एसडीपी-पीई, जो शफल मॉडल का उपयोग करता है, को प्रस्तुत करके सीपीएस वातावरण में गोपनीयता-संरक्षण सुदृढीकरण सीखने की समस्या के लिए एक नया समाधान प्रस्तावित करते हैं।
एसडीपी-पीई मौजूदा केंद्रीकृत और स्थानीय मॉडलों की सीमाओं पर काबू पाता है और गोपनीयता और प्रदर्शन के बीच प्रभावी रूप से संतुलन प्राप्त करता है।
हम एक घातीय बैच शेड्यूल और 'भूल' तंत्र के माध्यम से गोपनीयता और सीखने के प्रदर्शन के बीच संतुलन को प्रभावी ढंग से नियंत्रित करने के लिए एक विधि प्रस्तुत करते हैं।
सीपीएस के सुरक्षित डेटा-संचालित नियंत्रण के लिए शफल मॉडल की व्यावहारिकता का प्रदर्शन।
Limitations:
शफल मॉडल की मान्यताओं पर निर्भरता: चूंकि शफल मॉडल पूर्ण गुमनामी की गारंटी नहीं देता है, इसलिए शफलिंग प्रक्रिया के दौरान हमले की संभावना की जांच के लिए आगे अनुसंधान की आवश्यकता हो सकती है।
एल्गोरिथम की जटिलता: एसडीपी-पीई एल्गोरिथम की उच्च जटिलता के कारण इसे व्यवहार में लागू करना कठिन हो सकता है।
एपिसोडिक आरएल की सीमाएं: इस शोधपत्र के परिणाम एपिसोडिक आरएल तक सीमित हैं, तथा निरंतर आरएल समस्याओं पर उनकी प्रयोज्यता के लिए आगे अध्ययन की आवश्यकता है।
👍