दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

सीएमफिजबेंच: संघनित पदार्थ भौतिकी में बड़े भाषा मॉडलों के मूल्यांकन के लिए एक बेंचमार्क

एडीए-ट्रांसजीएनएन: अनुकूली ग्राफ कन्वोल्यूशनल नेटवर्क पर आधारित एक वायु गुणवत्ता पूर्वानुमान मॉडल

एब्लेशन के रूप में अनलर्निंग: जनरेटिव वैज्ञानिक खोज के लिए एक मिथ्याकरणीय बेंचमार्क की ओर

अपूर्ण-सूचना खेलों में स्थिर प्रतिद्वंद्वियों का सुसंगत प्रतिद्वंद्वियों का मॉडलिंग

हेस्टैक में आउटलायर्स का पता लगाना: बड़े पॉइंटक्लाउड दृश्यों के लिए विसंगति का पता लगाना

सॉफ्टवेयर के लिए एजेंटिक एआई: सॉफ्टवेयर इंजीनियरिंग समुदाय के विचार

(भाषा) अंतर पर ध्यान दें: LVLMs की संख्यात्मक और अंतर-भाषाई सीमाओं की जांच की दिशा में

अन्वेषण की अड़चन को तोड़ना: सामान्य एलएलएम तर्क के लिए रूब्रिक-स्कैफोल्डेड सुदृढीकरण सीखना

ड्रीम टू चैट: उपयोगकर्ता विश्वास मॉडलिंग के साथ संवाद पर मॉडल-आधारित सुदृढीकरण सीखना

वॉयस ऑथेंटिकेशन और एंटी-स्पूफिंग सिस्टम के खिलाफ खतरों का एक सर्वेक्षण

अनुसंधान और शिक्षण में जनरेटिव आर्टिफिशियल इंटेलिजेंस और एजेंट

CALR: कुशल वृहद भाषा मॉडल परत संपीड़न के लिए सुधारात्मक अनुकूली निम्न-रैंक अपघटन

शहरी 3D वातावरण में कुशल नेविगेशन के लिए यूएवी पथ नियोजन एल्गोरिदम का तुलनात्मक विश्लेषण

संदर्भ-आधारित तंत्रिका त्रुटि-पुस्तिका के माध्यम से उन्नत फीडबैक पुनर्प्राप्ति

एलएलएम में आत्मविश्वास से पतन तक तथ्यात्मक मजबूती

कार्य वेक्टर और ग्रेडिएंट पर

भुगतान हेरफेर के साथ बार-बार बहु-उद्देश्यीय स्टैकेलबर्ग खेलों में सीखना

NVIDIA नेमोट्रॉन नैनो 2: एक सटीक और कुशल हाइब्रिड माम्बा-ट्रांसफार्मर रीजनिंग मॉडल

DLLMQuant: प्रसार-आधारित बड़े भाषा मॉडल का परिमाणीकरण

एलएलएम - अनुशंसाओं के लिए उन्नत रैखिक ऑटोएनकोडर

ENSO की भविष्यवाणी में MEF विधि को बढ़ाने के लिए GNN का लाभ उठाना

अवरोध-जागरूक चेहरे के परिवर्तन के लिए अनिश्चितता-निर्देशित फेस मैटिंग

कक्षा में नया बच्चा: एआई कोडिंग सहायकों के बारे में छात्रों की धारणाओं का अन्वेषण

स्वचालित जनरेशन नियंत्रण प्रणालियों में व्याख्या योग्य साइबर हमले का पता लगाने के लिए वृहद भाषा मॉडल-आधारित ढाँचा

एसकेए-बेंच: एलएलएम की संरचित ज्ञान समझ के मूल्यांकन के लिए एक सूक्ष्म बेंचमार्क

एप्पल इंटेलिजेंस फाउंडेशन लैंग्वेज मॉडल: तकनीकी रिपोर्ट 2025

एसई-वीएलएन: बहुविधीय वृहद भाषा मॉडलों पर आधारित एक स्व-विकसित दृष्टि-भाषा नेविगेशन फ्रेमवर्क

बाल चिकित्सा कलाई फ्रैक्चर का जनसांख्यिकीय-जागरूक सूक्ष्म वर्गीकरण

क्रुल: गतिशील क्रॉस-लेयर केवी शेयरिंग के साथ बहु-टर्न वार्तालापों के लिए कुशल स्थिति बहाली

सौर ऊंचाई निर्देशित दृश्य रोशनी

ट्रेस करने योग्य तर्क के साथ दुर्लभ रोग निदान के लिए एक एजेंटिक प्रणाली

आवर्त सारणी में स्पेक्ट्रा-से-संरचना और संरचना-से-स्पेक्ट्रा अनुमान

यूएडी: रोबोटिक हेरफेर में सामान्यीकरण के लिए अप्रशिक्षित सामर्थ्य आसवन

पता लगाने के लिए बहस: बड़े भाषा मॉडल के साथ गलत सूचना का पता लगाने को वास्तविक दुनिया की बहस के रूप में पुनर्परिभाषित करना

ईवीएम-फ्यूजन: न्यूरल एल्गोरिथमिक फ्यूजन के साथ एक व्याख्या योग्य विजन माम्बा आर्किटेक्चर

RePPL: व्याख्या योग्य QA मतिभ्रम का पता लगाने के लिए अर्थ प्रसार और भाषा निर्माण में अनिश्चितता द्वारा व्याकुलता का पुनर्निर्धारण

ध्वनि घटना का पता लगाने के लिए SSL पर पुनर्विचार: पूरक संलयन और अनुकूली पोस्ट-प्रोसेसिंग

न्यूरल चंकिंग के माध्यम से अवधारणा-निर्देशित व्याख्या

जंगल में एलएलएम तैनाती के परिदृश्य का अनावरण: एक अनुभवजन्य अध्ययन

कानूनी मानदंडों के लिए एक ऑन्टोलॉजी-संचालित ग्राफ आरएजी: एक पदानुक्रमित, लौकिक और नियतात्मक दृष्टिकोण

प्रीफ़िल-स्तरीय जेलब्रेक: बड़े भाषा मॉडल का ब्लैक-बॉक्स जोखिम विश्लेषण

मल्टी-व्यू इकोकार्डियोग्राफी व्याख्या के लिए वीडियो क्लिप मॉडल

रेटिनल फंडस छवियों से अंतर्निहित रूप से व्याख्या योग्य रोग का पता लगाने के लिए एक हाइब्रिड पूर्णतः कन्वोल्यूशनल सीएनएन-ट्रांसफार्मर मॉडल

M$^2$IV: प्रतिनिधित्व इंजीनियरिंग के माध्यम से कुशल और सूक्ष्म बहुविधीय संदर्भ-आधारित शिक्षण की ओर

शोर-आधारित पुरस्कार-संशोधित शिक्षण

टोकन अतिरेक में कमी के साथ तेज़ पैरामीटर-कुशल ट्यूनिंग

यूनीजेनएक्स: एक एकीकृत जनरेटिव आधार मॉडल जो प्रोटीन, अणुओं और सामग्रियों में वैज्ञानिक डिजाइन को गति देने के लिए अनुक्रम, संरचना और कार्य को जोड़ता है

विचार-विमर्श बढ़ाने वाली संवाद प्रणालियों के साथ डीपफेक टेक्स्ट का सहयोगात्मक मूल्यांकन

बड़े भाषा मॉडल विकल्प की लंबाई, समस्या के प्रकार और अप्रासंगिक संज्ञा प्रतिस्थापनों के संबंध में खराब सामान्यीकरण करते हैं

टेबलटॉक: भाषा एजेंट के साथ स्प्रेडशीट विकास का ढांचा तैयार करना

स्टैगफॉर्मर: समानांतर में रनिंगलेयर्स के लिए टाइम स्टैगिंग ट्रांसफॉर्मर डिकोडिंग

हाइब्रिड ज़ोनोटोप रीचैबिलिटी विश्लेषण का उपयोग करके प्रमाणित रूप से सुरक्षित न्यूरल नेटवर्क प्रशिक्षण

जनरेटिव आर्टिफिशियल इंटेलिजेंस-समर्थित पेनटेस्टिंग: क्लाउड ओपस, GPT-4 और कोपायलट के बीच तुलना

एंट्रोपिक अन्वेषण के माध्यम से सुरक्षित मल्टीएजेंट समन्वय

टीएल-प्रशिक्षण: उपकरण उपयोग में बड़े भाषा मॉडल के प्रशिक्षण के लिए एक कार्य-विशेषता-आधारित ढांचा

एआई धारणा के सांस्कृतिक आयाम: जर्मनी और चीन में अपेक्षाएँ, जोखिम, लाभ, समझौते और मूल्य का निर्धारण

सीएडी-सहायक: सामान्य सीएडी कार्य समाधानकर्ता के रूप में उपकरण-संवर्धित वीएलएलएम

विशेषज्ञों और जनता के बीच जोखिम, लाभ और मूल्य में धारणा का अंतर सामाजिक रूप से स्वीकृत एआई को चुनौती देता है

ऑब्जेक्ट पुनर्व्यवस्था के लिए पदानुक्रमित ऑब्जेक्ट-ओरिएंटेड POMDP योजना

इरादों से बातचीत तक: बहु-बारी वर्गीकरण के लिए विपरीत शिक्षण के साथ इरादे-संचालित संवाद उत्पन्न करना

शफल गोपनीयता मॉडल के माध्यम से सुरक्षित सुदृढीकरण सीखना

लक्ष्य-जागरूक संघीय शिक्षा के साथ लेबल बदलाव पर काबू पाना

मानव-संरेखित मूल्यांकनों के साथ XAI स्पष्टीकरणों की बेंचमार्किंग

HonestCyberEval: स्वचालित सॉफ़्टवेयर शोषण के लिए एक AI साइबर जोखिम बेंचमार्क

विषम ग्राफ प्रतिनिधित्व सीखने के लिए बहु-पहलू पथों का लाभ उठाना

जीनेट: नेटवर्क टोपोलॉजी और कॉन्फ़िगरेशन के लिए एक मल्टीमॉडल एलएलएम-आधारित सह-पायलट

चैटजीपीटी को चार्जर्स प्रशंसकों पर भरोसा नहीं है: संदर्भ में गार्डरेल संवेदनशीलता

अहं-दूरदर्शिता: बेहतर RL के लिए एजेंट-जागरूक अभ्यावेदन का स्व-पर्यवेक्षित शिक्षण

ध्यान विश्लेषण के माध्यम से सारणीबद्ध प्रश्नोत्तर के लिए भाषा मॉडल की मजबूती की खोज

पिक्सेल से काउंटी सीखना: ध्यान-भारित बहु-उदाहरण सीखने के साथ मक्का उपज का पूर्वानुमान

छवि पुनर्स्थापना के लिए आपको केवल मेमोरी संवर्द्धन की आवश्यकता है

वितरण बदलावों पर पुनर्विचार: सारणीबद्ध आंकड़ों के लिए अनुभवजन्य विश्लेषण और आगमनात्मक मॉडलिंग

डिफब्लेंडर: संयोज्य और बहुमुखी मल्टीमॉडल टेक्स्ट-टू-इमेज डिफ्यूजन मॉडल

विभेदक पैटर्न से परे: निर्णय नियम समूहों की मजबूती पर

स्वायत्त सुरक्षित ग्रहीय लैंडिंग के लिए विभाजन हेतु बायेसियन गहन शिक्षण

एसटी-रैप्टर: एलएलएम-संचालित अर्ध-संरचित टेबल प्रश्नोत्तर

रूट-एंड-एक्ज़ीक्यूट: ऑडिटेबल मॉडल-कार्ड मिलान और विशेषता-स्तरीय परिनियोजन

औषधि परिसंपत्ति के समुचित परिश्रम में प्रतिस्पर्धी परिदृश्य मानचित्रण के लिए एलएलएम-आधारित एजेंट

चैटबॉट्स के साथ परासामाजिक संबंधों को रोकने के लिए प्रतिक्रिया और त्वरित मूल्यांकन

प्रोफ़ाइल-जागरूक पैंतरेबाज़ी: AWorld द्वारा मजबूत GAIA समस्या समाधान के लिए एक गतिशील बहु-एजेंट प्रणाली

एआई-आधारित प्रणालियों के लिए नैतिकता अधिवक्ता के रूप में मल्टी-एजेंट एलएलएम

मॉडल भविष्यवाणियों के गैर-विशेषज्ञ मूल्यांकन के लिए विशेषता-निर्देशित पड़ोसी चयन

नैदानिक सहयोग की रूपरेखा: बहुविध चिकित्सा VQA के लिए बहु-एजेंट तर्क प्रणालियाँ

MRAG: मल्टी-मोडल रिट्रीवल-ऑगमेंटेड जेनरेशन के डिज़ाइन स्पेस को स्पष्ट करना

जिगसॉ-पज़ल्स: दृष्टि-भाषा मॉडल में देखने से लेकर समझने और तर्क करने तक

एलएलएम-संचालित रणनीतिक तर्ककर्ताओं में मानव-प्रेरित एजेंटिक परिष्कार का प्रभाव

यूलान-वनसिम: बड़े भाषा मॉडल के साथ सामाजिक सिम्युलेटर की अगली पीढ़ी की ओर

गति में सहमति: संभाव्यता एकत्रीकरण में अनुक्रमिक अधिगम की गतिशील तर्कसंगतता का एक मामला

क्या बड़े भाषा मॉडल मल्टी-जीएनएन के लिए एनसेम्बलर के रूप में कार्य कर सकते हैं?

मजबूत POMDP के लिए RNNs के साथ निराशावादी पुनरावृत्तीय योजना

अनुकूली परिरक्षण के माध्यम से ब्लैक-बॉक्स वातावरण में सुरक्षित सुदृढीकरण सीखना

बेहतर कारणात्मक खोज के लिए बड़े भाषा मॉडल को एकीकृत करना

कारण खोज पर एक सर्वेक्षण: सिद्धांत और व्यवहार

भाषा मॉडल के लिए जनरेटिव इंटरफेस

डेटा विस्तार के लिए एम्बेडिंग स्पेस में स्पीकर पहचानों का अंतर्वेशन

वाइबवॉयस तकनीकी रिपोर्ट

एलएसडी-3डी: ज्यामिति ग्राउंडिंग के साथ बड़े पैमाने पर 3डी ड्राइविंग दृश्य निर्माण

टूल-एकीकृत तर्क को समझना

अस्पष्टता-जागरूक क्रमिक निरूपण के रूप में भावनाएँ

बंद-लूप रोबोट प्रतिक्रियाशील योजना के लिए वास्तविक समय मॉडल जाँच

क्रुल: गतिशील क्रॉस-लेयर केवी शेयरिंग के साथ बहु-टर्न वार्तालापों के लिए कुशल स्थिति बहाली

Created by

Haebom

लेखक

जुनयी वेन, जुनयुआन लियांग, ज़िकोंग होंग, वुहुई चेन, टिंग कै, ज़िबिन झेंग

रूपरेखा

यह शोधपत्र बड़े पैमाने के भाषा मॉडलों (LLM) के बहु-चक्र वार्तालापों में कुशल अवस्था पुनर्स्थापन की समस्या के समाधान हेतु Krul नामक एक प्रणाली का प्रस्ताव करता है। सभी वार्तालापों पर समान संपीड़न विधि लागू करने वाली मौजूदा KV कैश संपीड़न विधियों की सीमाओं को दूर करने के लिए, Krul वार्तालापों में ध्यान पैटर्न समानता को ध्यान में रखते हुए गतिशील रूप से एक संपीड़न रणनीति का चयन करता है। प्रमुख नवाचारों में पूर्वानुमानित संपीड़न रणनीति चयन, टोकन-वार विषमांगी ध्यान समानता अनुमान, और एक बबल-मुक्त पुनर्स्थापन अनुसूचक शामिल हैं। प्रायोगिक परिणाम दर्शाते हैं कि Krul, सर्वोत्तम प्रदर्शन करने वाली मौजूदा विधियों की तुलना में, समान उत्पादन गुणवत्ता बनाए रखते हुए, TTFT को क्रमशः 1.5x और 2.68x, और KV कैश संग्रहण को क्रमशः 1.33x और 2.35x कम करता है।

Takeaways, Limitations

•

Takeaways:

◦

हम प्रदर्शित करते हैं कि संवादात्मक विशेषताओं के अनुरूप गतिशील केवी कैश संपीड़न रणनीति का उपयोग करके एलएलएम अनुमान दक्षता में काफी सुधार किया जा सकता है।

◦

टीटीएफटी और केवी कैश भंडारण क्षमता को कम करके एलएलएम-आधारित अनुप्रयोगों के प्रदर्शन और मापनीयता में सुधार करने में योगदान देता है।

◦

हम पूर्वानुमानित संपीड़न रणनीति चयन, टोकन-वार विषम ध्यान समानता अनुमान, और बुलबुला-मुक्त पुनर्स्थापना अनुसूचक जैसी नवीन तकनीकें प्रस्तुत करते हैं।

•

Limitations:

◦

क्रुल के प्रदर्शन सुधार विशिष्ट डेटासेट और कार्यों के लिए प्रयोगात्मक परिणामों पर आधारित हैं, और अन्य वातावरणों में सामान्यीकरण के लिए और अधिक शोध की आवश्यकता है।

◦

गतिशील संपीड़न रणनीति चयन से संबंधित कम्प्यूटेशनल ओवरहेड हो सकता है, जिसके लिए अनुकूलन की आवश्यकता हो सकती है।

◦

प्रस्तावित विधि की जटिलता के कारण कार्यान्वयन और रखरखाव कठिन हो सकता है।

पीडीएफ देखें

Made with Slashpage