दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

अस्पष्टता-जागरूक क्रमिक निरूपण के रूप में भावनाएँ

टेबुला रासा से उभरती क्षमताओं तक: वास्तविक दुनिया के अप्रशिक्षित गुणवत्ता-विविधता के माध्यम से रोबोट कौशल की खोज

रैंडम मास्किंग और क्वांटाइजेशन के साथ फेडरेटेड लर्निंग में मॉडल गोपनीयता को बढ़ाना

प्रशिक्षण-पश्चात क्वांटाइज्ड वृहद भाषा मॉडल में कार्य-स्तरीकृत ज्ञान के लिए स्केलिंग नियम

बहु-परीक्षण के माध्यम से बड़े भाषा मॉडल में मतिभ्रम का सिद्धांत-आधारित पता लगाना

वोकोडर-प्रोजेक्टेड फ़ीचर डिस्क्रिमिनेटर

कंट्रोलइकोसिंथ: नियंत्रित वीडियो प्रसार के माध्यम से इजेक्शन फ्रैक्शन अनुमान मॉडल को बढ़ावा देना

उत्तर देने से पहले समझाएँ: रचनात्मक दृश्य तर्क पर एक सर्वेक्षण

वास्तविक-विश्व छवि सुपर-रिज़ॉल्यूशन के लिए समय-जागरूक एक चरण प्रसार नेटवर्क

PediatricsMQA: एक बहु-मोडल बाल चिकित्सा प्रश्न उत्तर बेंचमार्क

वीडियोइरेज़र: टेक्स्ट-टू-वीडियो डिफ्यूजन मॉडल में अवधारणा मिटाना

मॉडल निष्कर्षण हमलों और बचावों का एक व्यवस्थित सर्वेक्षण: अत्याधुनिक और परिप्रेक्ष्य

जियोएसएएम2: 3डी पार्ट सेगमेंटेशन के लिए एसएएम2 की शक्ति का उपयोग

इनपुट-समय स्केलिंग

लिंग्वासेफ: बड़े भाषा मॉडलों के लिए एक व्यापक बहुभाषी सुरक्षा बेंचमार्क

समानांतर पाठ निर्माण पर एक सर्वेक्षण: समानांतर डिकोडिंग से प्रसार भाषा मॉडल तक

स्ट्रीटव्यूएआई: संदर्भ-जागरूक मल्टीमॉडल एआई का उपयोग करके स्ट्रीट व्यू को सुलभ बनाना

पुटनाम-एक्सिओम: एलएलएम में उच्च स्तरीय गणितीय तर्क को मापने के लिए एक कार्यात्मक और स्थैतिक बेंचमार्क

अनुकरण से अनुकूलन तक: स्वायत्त ड्राइविंग के लिए ऑफ़लाइन सीखने का एक तुलनात्मक अध्ययन

आर-ज़ीरो: शून्य डेटा से स्व-विकसित तर्क एलएलएम

मानव-केंद्रित मानव-एआई इंटरैक्शन (एचसी-एचएआईआई): एक मानव-केंद्रित एआई परिप्रेक्ष्य

जीटीपीओ: बड़े भाषा मॉडल में प्रक्षेप-पथ आधारित नीति अनुकूलन

दवा खोज के लिए विलायक-जागरूक संवर्धन के साथ विपरीत बहु-कार्य शिक्षण

स्थानिक ट्रांसक्रिप्टोमिक्स में ऊतक विज्ञान और जीन अभिव्यक्ति के लिए क्रॉस-मोडल लर्निंग का एक बड़े पैमाने का बेंचमार्क

विचारों की अदृश्य वास्तुकला: संज्ञानात्मक अवसंरचना के रूप में एआई के एक नए विज्ञान की ओर

भेद्यता का पता लगाने के लिए पूर्व-प्रशिक्षित भाषा मॉडल पर पुनर्विचार

मेगासाइंस: विज्ञान तर्क के लिए प्रशिक्षण-पश्चात डेटासेट की सीमाओं को आगे बढ़ाना

फ्लॉक के साथ विकेंद्रीकृत शिक्षा का विस्तार

सेगक्वांट: प्रसार मॉडल के लिए एक अर्थ-जागरूक और सामान्यीकरण योग्य क्वांटीकरण ढांचा

एप्पल इंटेलिजेंस फाउंडेशन लैंग्वेज मॉडल: तकनीकी रिपोर्ट 2025

जोखिम-विरोधी विवश सुदृढीकरण सीखने के लिए आशावादी अन्वेषण

पायविज़न: डायनेमिक टूलिंग के साथ एजेंटिक विज़न

डेटाबेंच: डीप लर्निंग में डेटासेट ऑडिटिंग का एक प्रतिकूल दृष्टिकोण से मूल्यांकन

रोबोट्विन 2.0: मजबूत द्वि-मैनुअल रोबोटिक हेरफेर के लिए मजबूत डोमेन रैंडमाइजेशन के साथ एक स्केलेबल डेटा जनरेटर और बेंचमार्क

मल्टीमॉडल फाउंडेशन मॉडल का उपयोग करके मीडिया सामग्री में चरित्र प्रतिनिधित्व का विश्लेषण: प्रभावशीलता और विश्वास

एमईरेज़र: बड़े भाषा मॉडलों के लिए एक प्रभावी फ़िंगरप्रिंट मिटाने का तरीका

CoQuIR: कोड गुणवत्ता-जागरूक सूचना पुनर्प्राप्ति के लिए एक व्यापक बेंचमार्क

ड्रीमएक्टर-एच1: मोशन-डिज़ाइन किए गए डिफ्यूज़न ट्रांसफ़ॉर्मर्स के माध्यम से उच्च-विश्वसनीयता वाले मानव-उत्पाद प्रदर्शन वीडियो निर्माण

स्वायत्त ड्राइविंग के लिए छद्म-सिमुलेशन

BinConv: समय-श्रृंखला पूर्वानुमान में क्रमसूचक एन्कोडिंग के लिए एक तंत्रिका वास्तुकला

फेसएडिटटॉकर: चेहरे की विशेषताओं के संपादन के साथ नियंत्रणीय टॉकिंग हेड जनरेशन

EnvInjection: बहु-मोडल वेब एजेंटों पर पर्यावरणीय त्वरित इंजेक्शन हमला

X-सिम: रियल-टू-सिम-टू-रियल के माध्यम से क्रॉस-एम्बोडीमेंट लर्निंग

ऊष्मा प्रसार मॉडल -- अंतरपिक्सल ध्यान तंत्र

रणनीतिक टकराव के लिए पदानुक्रमित सुदृढीकरण सीखने पर आधारित द्विदिशात्मक कार्य-गति योजना

विशेषज्ञों के मिश्रण के माध्यम से बहु-प्रकार संदर्भ-जागरूक संवादात्मक अनुशंसा प्रणालियाँ

मूल्य निर्धारण AI मॉडल सटीकता

प्रश्न निर्माण के कार्य के लिए ऑन्टोलॉजी की उपयुक्तता का मूल्यांकन

पुनर्प्राप्ति और पुनर्प्राप्ति-संवर्धित पीढ़ी के लिए उपयोगिता-केंद्रित एलएलएम एनोटेशन

पीजीएडी: एडी निदान में बहु-मोडल सीखने के लिए प्रोटोटाइप-निर्देशित अनुकूली आसवन

बच्चों के वैज्ञानिक चित्रण के लिए एक मानदंड का निर्माण: बड़े भाषा मॉडलों की अर्थगत समानता पर आधारित वितरण विशेषताएँ

ऑफ़लाइन व्युत्क्रम RL और गतिशील असतत विकल्प मॉडल के लिए एक अनुभवजन्य जोखिम न्यूनीकरण दृष्टिकोण

समाधान स्थान के बहु-शीर्ष यूनिमॉड्यूलर नियमन के माध्यम से कुशल PINNs

सांख्यिकीय शिक्षा में हमेशा ज्ञान शामिल नहीं होता

सामाजिक अनुशंसाओं के लिए स्कोर-आधारित जनरेटिव डिफ्यूजन मॉडल

प्रॉम्प्टकीपर: एलएलएम के लिए सिस्टम प्रॉम्प्ट्स की सुरक्षा

X-प्रॉम्प्ट: ऑटो-रिग्रैसिव विज़न लैंग्वेज फाउंडेशन मॉडल में सार्वभौमिक इन-कॉन्टेक्स्ट इमेज जेनरेशन की ओर

मशीन लर्निंग मॉडल में निष्पक्षता-सटीकता के बीच के अंतर को समझना: क्या निष्पक्षता को बढ़ावा देने से प्रदर्शन कमजोर होता है?

जीएसएम-प्रतीकात्मक: बड़े भाषा मॉडल में गणितीय तर्क की सीमाओं को समझना

विषम ग्राफ प्रतिनिधित्व सीखने के लिए बहु-पहलू पथों का लाभ उठाना

केवल स्पष्टीकरण के साथ प्रशिक्षण: शॉर्टकट सीखने को रोकने के लिए एक नया प्रतिमान

मध्यबिंदुओं की भविष्यवाणी करने के लिए अभिनेता-आलोचक सुदृढीकरण सीखने के साथ जियोडेसिक्स का निर्माण

TabSketchFM: डेटा झीलों पर डेटा खोज के लिए स्केच-आधारित सारणीबद्ध प्रतिनिधित्व सीखना

हनीबी: आधारभूत एम्बेडिंग मॉडल के साथ मल्टीमॉडल ऑन्कोलॉजी डेटासेट बनाने के लिए एक स्केलेबल मॉड्यूलर फ्रेमवर्क

स्टेपवाइजर: बुद्धिमान तर्क के लिए चरणबद्ध जनरेटिव न्यायाधीश

एनीमे: लंबे एनीमेशन निर्माण के लिए अनुकूली बहु-एजेंट योजना

AppAgent-Pro: बहु-डोमेन सूचना एकीकरण और उपयोगकर्ता सहायता के लिए एक सक्रिय GUI एजेंट प्रणाली

चैटबॉट्स के साथ पैरासोशल रिश्तों को रोकने के लिए आपको (वास्तव में) केवल AI चैपरोन की ही आवश्यकता है

नेमोरी: संज्ञानात्मक विज्ञान से प्रेरित स्व-संगठित एजेंट मेमोरी

सामान्य एजेंटों में विश्व मॉडल होते हैं

अनुमानित लिफ्टेड मॉडल निर्माण

बड़े भाषा मॉडल-सहायता प्राप्त स्वचालित एल्गोरिथम खोज का फिटनेस परिदृश्य

एलएलएम-आधारित विशेषज्ञ और छात्र एजेंटों के साथ उच्च-गुणवत्ता वाले प्रोग्रामिंग कार्यों का संश्लेषण

सक्रिय शिक्षण और अधिकतम संभाव्यता अनुमान के साथ बहु-उद्देश्यीय संयोजन अनुकूलन के लिए वरीयता उद्दीपन

संदर्भ-संरेखित पुनर्प्राप्ति-विषम स्वामित्व दस्तावेजों पर संवर्धित प्रश्नोत्तर

गेमिंग रीजनिंग मॉडल में विशिष्टताओं का प्रदर्शन

AirRAG: स्वायत्त रणनीतिक योजना और तर्क स्टीयर रिट्रीवल संवर्धित पीढ़ी

स्मार्ट सोचें, स्मार्ट तरीके से काम करें! मल्टी-एजेंट रीइन्फोर्समेंट लर्निंग के लिए संभाव्य तर्क ढालों का विश्लेषण

साक्ष्य से निर्णय तक: मूल्यांकनात्मक AI की खोज

CODA: द्वि-मस्तिष्क कंप्यूटर उपयोग एजेंट के लिए सेरेब्रम और सेरिबैलम का समन्वय, वियुग्मित सुदृढीकरण अधिगम के साथ

स्केलेबल और सुरक्षित मल्टी-रोबोट मोशन प्लानिंग के लिए डिस्क्रीट-गाइडेड डिफ्यूजन

2D OCT स्लाइस के दो जोड़ों के बीच विकास को वर्गीकृत करने के लिए फ्यूजन CNN नेटवर्क के साथ पैच प्रोग्रेसन मास्क्ड ऑटोएनकोडर

डीपस्कॉलर-बेंच: जनरेटिव रिसर्च सिंथेसिस के लिए एक लाइव बेंचमार्क और स्वचालित मूल्यांकन

इलेक्ट्रॉनिक डिज़ाइन ऑटोमेशन (EDA) के लिए बड़े भाषा मॉडल (LLM)

सिम्फनी: स्केलेबल कलेक्टिव इंटेलिजेंस के लिए एक विकेन्द्रीकृत मल्टी-एजेंट फ्रेमवर्क

शेड्यूलिंग नीतियों, प्रोत्साहन संरचनाओं और बिजली एवं शीतलन पर उनके प्रभाव के मूल्यांकन के लिए एचपीसी डिजिटल ट्विन्स

एलएलएम में व्यवहारिक चरण संक्रमणों का विघटन: आकस्मिक मिसलिग्न्मेंट के लिए क्रम पैरामीटर

क्रॉस-प्लेटफ़ॉर्म ई-कॉमर्स उत्पाद वर्गीकरण और पुनर्वर्गीकरण: एक बहुविध पदानुक्रमित वर्गीकरण दृष्टिकोण

ग्रेडिएंट अनुमान के माध्यम से संदर्भ-आधारित शिक्षण के लिए रैखिक-समय प्रदर्शन चयन

मैथबडी: प्रभावी गणित शिक्षण के लिए एक बहुविध प्रणाली

प्रसार भाषा मॉडल: डिकोडिंग से पहले उत्तर जानें

GLSim: वैश्विक-स्थानीय समानता के माध्यम से LVLMs में वस्तु विभ्रम का पता लगाना

धति+: अरबी व्यक्तिपरकता मूल्यांकन के लिए परिष्कृत बड़े भाषा मॉडल

WaveHiT-SR: कुशल छवि सुपर-रिज़ॉल्यूशन के लिए पदानुक्रमित वेवलेट नेटवर्क

अगली परत: कम्प्यूटेशनल पैथोलॉजी में स्थानीय पैच से लेकर वैश्विक संदर्भ जागरूकता तक संरचना-संरक्षण और ध्यान-निर्देशित शिक्षण के साथ आधारभूत मॉडल का संवर्धन

परीक्षा-समय स्केलिंग के लिए परिणाम पुरस्कार मॉडल के साथ तार्किक तर्क

जनरेटिव डिफ्यूजन की सूचना गतिशीलता

मेडिकल स्कूल के पाठ्यक्रम में अनुचित भाषा का एआई-संचालित पता लगाना

स्वायत्त ड्राइविंग प्रणालियों के परीक्षण के लिए जनरेटिव एआई: एक सर्वेक्षण

शहरी और उपनगरीय क्षेत्रों में वृक्ष बिंदुओं को निकालने के लिए मल्टीस्पेक्ट्रल LiDAR डेटा

भेद्यता का पता लगाने के लिए पूर्व-प्रशिक्षित भाषा मॉडल पर पुनर्विचार

Created by

Haebom

लेखक

यूपेंग ली, वेइलियांग क्यूई, ज़ुयू वांग, फ़क्सुन यू, ज़िंदा वांग

रूपरेखा

यह शोधपत्र भेद्यता पहचान (VD) के लिए एक पूर्व-प्रशिक्षित भाषा मॉडल (PLM) RevisitVD का एक व्यापक अध्ययन प्रस्तुत करता है। एक नए निर्मित डेटासेट का उपयोग करते हुए, हम 17 PLM (लघु-स्तरीय, कोड-विशिष्ट PLM और वृहद्-स्तरीय PLM सहित) का उपयोग करके फ़ाइन-ट्यूनिंग और प्रॉम्प्ट इंजीनियरिंग दृष्टिकोणों की तुलना करते हैं। हम विभिन्न प्रशिक्षण और परीक्षण सेटिंग्स, सामान्यीकरण क्षमता, और कोड सामान्यीकरण, अमूर्तन और अर्थगत परिवर्तनों के प्रति उनकी मजबूती का मूल्यांकन करते हैं। हम पाते हैं कि कोड के वाक्यात्मक और अर्थगत पैटर्न को पकड़ने के लिए डिज़ाइन किए गए पूर्व-प्रशिक्षित कार्य को शामिल करने वाला PLM, केवल बड़े कोड कॉर्पोरा पर सामान्य-उद्देश्य वाले PLM या पूर्व-प्रशिक्षित या फ़ाइन-ट्यून्ड PLM से बेहतर प्रदर्शन करता है। हालाँकि, हम यह भी पाते हैं कि यह वास्तविक दुनिया के परिदृश्यों में, जैसे जटिल निर्भरताओं वाली भेद्यताओं का पता लगाना, कोड सामान्यीकरण और अमूर्तन के कारण होने वाले परिवर्तनों को संभालना, और अर्थगत रूप से भेद्य कोड परिवर्तनों की पहचान करना, संघर्ष करता है। हम यह भी उजागर करते हैं कि PLM की सीमित संदर्भ विंडो, ट्रंकेशन के कारण महत्वपूर्ण लेबलिंग त्रुटियों का कारण बन सकती है।

Takeaways, Limitations

•

Takeaways: हम दर्शाते हैं कि कोड में वाक्यविन्यास और अर्थ संबंधी पैटर्न पर विचार करने वाला पूर्व-प्रशिक्षण VD प्रदर्शन में सुधार के लिए महत्वपूर्ण है। हम व्यावहारिक VD अनुप्रयोगों के लिए PLM मूल्यांकन के महत्व पर ज़ोर देते हैं।

•

Limitations: इससे वास्तविक दुनिया के परिदृश्यों में इसे लागू करने में चुनौतियाँ आती हैं, जिनमें जटिल निर्भरताओं वाली कमज़ोरियाँ, कोड रूपांतरण, और सीमित संदर्भ विंडो के कारण लेबलिंग त्रुटियाँ शामिल हैं। PLM के वास्तविक दुनिया में अनुप्रयोग को सुनिश्चित करने के लिए सुधार के सुझावों की आवश्यकता है।

पीडीएफ देखें

Made with Slashpage