दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

सीक्वेल: टेक्स्ट क्लस्टरिंग के लिए बड़े भाषा मॉडल की लागत-प्रभावी क्वेरी

Created by
  • Haebom

लेखक

होंगताओ वांग, ताइयान झांग, रेंची यांग, जियानलियांग जू

रूपरेखा

यह शोधपत्र बड़े पैमाने के भाषा मॉडल (LLM) का उपयोग करके टेक्स्ट क्लस्टरिंग की उच्च लागत को कम करने के लिए Cequel नामक एक लागत-प्रभावी ढाँचे का प्रस्ताव करता है। Cequel, सूचना-समृद्ध टेक्स्ट युग्मों या त्रिक के लिए LLM को चुनिंदा रूप से क्वेरी करने के लिए EdgeLLM और TriangleLLM नामक एल्गोरिदम का उपयोग करता है, जिससे अनिवार्य-लिंक और गैर-लिंक प्रतिबंध उत्पन्न होते हैं। फिर इन प्रतिबंधों का उपयोग उच्च-गुणवत्ता वाले क्लस्टर बनाने के लिए एक भारित प्रतिबंध क्लस्टरिंग एल्गोरिदम में किया जाता है। EdgeLLM और TriangleLLM एक सावधानीपूर्वक डिज़ाइन की गई लालची चयन रणनीति और प्रॉम्प्टिंग तकनीक का उपयोग करके सूचना-समृद्ध प्रतिबंधों की कुशलतापूर्वक पहचान और निष्कर्षण करते हैं। विभिन्न बेंचमार्क डेटासेट पर प्रायोगिक परिणाम दर्शाते हैं कि Cequel समान क्वेरी बजट में मौजूदा अप्रशिक्षित टेक्स्ट क्लस्टरिंग विधियों से बेहतर प्रदर्शन करता है।

Takeaways, Limitations

Takeaways:
हम एक लागत प्रभावी ढांचा प्रस्तुत करते हैं जो सीमित एलएलएम क्वेरी बजट के तहत भी सटीक टेक्स्ट क्लस्टरिंग प्राप्त करता है।
EdgeLLM और TriangleLLM एल्गोरिदम का उपयोग करके सूचना-समृद्ध बाधाओं को कुशलतापूर्वक निकालकर प्रदर्शन में सुधार करें।
यह विभिन्न बेंचमार्क डेटासेट पर मौजूदा विधियों की तुलना में बेहतर प्रदर्शन प्रदर्शित करता है।
Limitations:
प्रस्तावित एल्गोरिथम की इष्टतम पैरामीटर सेटिंग्स पर विस्तृत चर्चा का अभाव हो सकता है।
विभिन्न प्रकार के एलएलएम के लिए सामान्यीकरण प्रदर्शन के आगे विश्लेषण की आवश्यकता हो सकती है।
व्यावहारिक अनुप्रयोगों के लिए मापनीयता और वास्तविक समय प्रसंस्करण प्रदर्शन का मूल्यांकन करने की आवश्यकता हो सकती है।
👍