दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

बड़े भाषा मॉडल वाले जटिल प्रोग्रामों के लिए स्वचालित लूप इनवेरिएंट जनरेशन को बढ़ाना

Created by
  • Haebom

लेखक

रुइबांग लियू, गुओकियांग ली, मिन्यू चेन, लिंग-आई वू, जिंग्यु के

रूपरेखा

यह शोधपत्र स्वचालित प्रोग्राम सत्यापन की चुनौतियों का समाधान करने के लिए एक नवीन उपकरण, ACInv, प्रस्तावित करता है, जो विश्वसनीय सॉफ़्टवेयर के निर्माण के लिए अत्यंत महत्वपूर्ण है, विशेष रूप से जटिल डेटा संरचनाओं और नियंत्रण प्रवाह वाले वास्तविक-विश्व प्रोग्रामों का विश्लेषण करते समय। ACInv, स्थैतिक विश्लेषण को एक बड़े पैमाने के भाषा मॉडल (LLM) के साथ संयोजित करके लूप इनवेरिएंट उत्पन्न करता है। यह स्थैतिक विश्लेषण के माध्यम से लूप जानकारी निकालता है और उसे LLM प्रॉम्प्ट में एम्बेड करता है। फिर यह उत्पन्न इनवेरिएंट को सत्यापित करने और इष्टतम इनवेरिएंट प्राप्त करने के लिए उन्हें सुदृढ़, दुर्बल या अस्वीकृत करने के लिए एक LLM-आधारित मूल्यांकनकर्ता का उपयोग करता है। प्रायोगिक परिणाम दर्शाते हैं कि ACInv, डेटा संरचनाओं वाले डेटासेट पर मौजूदा उपकरणों से बेहतर प्रदर्शन करता है, जबकि डेटा संरचनाओं के बिना संख्यात्मक प्रोग्रामों पर अत्याधुनिक उपकरण, AutoSpec, के तुलनीय प्रदर्शन बनाए रखता है। यह यह भी दर्शाता है कि ACInv, संपूर्ण डेटासेट में AutoSpec की तुलना में 21% अधिक उदाहरणों को हल करता है और संदर्भ डेटा संरचना टेम्पलेट उत्पन्न करता है।

Takeaways, Limitations

Takeaways:
हम एक नवीन विधि प्रस्तुत करते हैं जो स्थैतिक विश्लेषण और एलएलएम के संयोजन द्वारा जटिल कार्यक्रमों के लिए लूप इनवेरिएंट उत्पन्न करने की समस्या को प्रभावी ढंग से हल करती है।
यह उन प्रोग्रामों में मौजूदा उपकरणों से बेहतर प्रदर्शन करता है जिनमें डेटा संरचनाएं शामिल होती हैं।
संदर्भ डेटा संरचना टेम्पलेट्स बनाने की क्षमता प्रदान करता है।
हम एलएलएम-आधारित मूल्यांकनकर्ता का उपयोग करके इनवेरिएंट की सटीकता को सत्यापित और सुधारते हैं।
Limitations:
डेटा संरचनाओं के बिना संख्यात्मक कार्यक्रमों का प्रदर्शन अत्याधुनिक उपकरणों के बराबर है, लेकिन प्रदर्शन में बहुत अधिक सुधार नहीं दिखता है।
चूंकि यह एलएलएम के प्रदर्शन पर निर्भर करता है, एलएलएम की सीमाएं एसीआईएनवी के प्रदर्शन को प्रभावित कर सकती हैं।
प्रयोगात्मक डेटासेट के दायरे और विविधता के आधार पर प्रदर्शन भिन्न हो सकता है। अधिक व्यापक प्रयोगों की आवश्यकता हो सकती है।
👍