दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ENSI: बड़े भाषा मॉडल के लिए कुशल गैर-इंटरैक्टिव सुरक्षित अनुमान

Created by
  • Haebom

लेखक

झियू हे, माओजियांग वांग, शिनवेन गाओ, युचुआन लुओ, लिन लियू, शाओजिंग फू

रूपरेखा

यह पत्र ENSI का प्रस्ताव करता है, जो बड़े पैमाने के भाषा मॉडल (LLM) पर सुरक्षित अनुमान के लिए एक नवीन गैर-संवादात्मक ढाँचा है। क्रिप्टोग्राफ़िक प्रोटोकॉल और LLM आर्किटेक्चर के सह-डिज़ाइन सिद्धांत पर आधारित, ENSI एन्क्रिप्टेड मैट्रिक्स गुणन की कम्प्यूटेशनल जटिलता को उल्लेखनीय रूप से कम करने के लिए CKKS योजना को एक हल्के LLM संस्करण, BitNet के साथ एकीकृत करता है। इसके अलावा, होमोमॉर्फिक एन्क्रिप्शन (HE) के तहत सॉफ्टमैक्स के कम्प्यूटेशनल बोझ को कम करने के लिए, हम एक वैकल्पिक दृष्टिकोण प्रस्तावित करते हैं जो सिग्मॉइड अटेंशन मैकेनिज्म को HE के साथ एकीकृत करके पुनर्प्रशिक्षण की आवश्यकता को समाप्त करता है। इसके अलावा, हम बूटस्ट्रैपिंग ऑपरेशन को RMSNorm प्रक्रिया में एकीकृत करते हैं, जिससे सिफरटेक्स्ट को कुशलतापूर्वक रिफ्रेश किया जा सकता है और साथ ही महंगी बूटस्ट्रैपिंग कॉल की आवृत्ति को भी उल्लेखनीय रूप से कम किया जा सकता है। प्रायोगिक परिणाम दर्शाते हैं कि ENSI, अत्याधुनिक विधियों की तुलना में CPU पर मैट्रिक्स गुणन गति को लगभग 8 गुना और सॉफ्टमैक्स अनुमान गति को 2.6 गुना बेहतर बनाता है, जबकि बूटस्ट्रैपिंग अनुपात को 1% तक कम करता है।

Takeaways, Limitations

Takeaways:
हम एक कुशल फ्रेमवर्क ENSI प्रस्तुत करते हैं जो LLM के लिए सुरक्षित अनुमान की व्यावहारिकता में महत्वपूर्ण सुधार करता है।
सीकेकेएस और बिटनेट का एकीकरण एन्क्रिप्टेड मैट्रिक्स गुणन की कम्प्यूटेशनल जटिलता को काफी कम कर देता है।
सिग्मॉइड ध्यान तंत्र को HE के साथ एकीकृत करके सॉफ्टमैक्स गणना की दक्षता में वृद्धि करना।
बूटस्ट्रैपिंग परिचालनों के कुशल एकीकरण के माध्यम से सिफरटेक्स्ट रिफ्रेश और बूटस्ट्रैपिंग लागत में कमी।
प्रायोगिक परिणाम स्पष्ट रूप से ENSI के प्रदर्शन में सुधार को प्रदर्शित करते हैं।
Limitations:
ENSI का प्रदर्शन प्रयुक्त हार्डवेयर और LLM आकार के आधार पर भिन्न हो सकता है।
बिटनेट जैसे हल्के एलएलएम वेरिएंट के उपयोग के लिए प्रदर्शन और सटीकता के बीच समझौता करना पड़ सकता है।
चूंकि प्रयोगात्मक परिणाम एक विशिष्ट वातावरण में प्राप्त किये गये थे, इसलिए सामान्यीकरण सीमित हो सकता है।
अन्य एन्क्रिप्शन योजनाओं या एलएलएम आर्किटेक्चर पर इसकी प्रयोज्यता पर आगे अनुसंधान की आवश्यकता है।
👍