दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

कोबलस्टोन: औपचारिक सत्यापन के लिए पुनरावृत्त स्वचालन

Created by
  • Haebom

लेखक

साकेत राम कासिबातला, अर्पण अग्रवाल, यूरी ब्रून, सोरिन लर्नर, तालिया रिंगर, एमिली फर्स्ट

रूपरेखा

कोबलस्टोन, कॉक प्रूफ असिस्टेंट के लिए एक नवीन प्रमाण संश्लेषण विधि है, जो एक बड़े पैमाने के भाषा मॉडल (एलएलएम) का लाभ उठाते हुए, फूट डालो और जीतो की रणनीति का उपयोग करती है। यह एलएलएम द्वारा उत्पन्न आंशिक प्रमाणों का उपयोग करके समस्या को छोटी उपसमस्याओं में विभाजित करता है और सफलतापूर्वक सिद्ध की गई उपसमस्याओं की स्वचालित रूप से पहचान करता है। फिर यह शेष उपसमस्याओं पर प्रमाण को बार-बार दोहराता है ताकि अंततः एक सही और ठोस समग्र प्रमाण तैयार किया जा सके। ओपन-सोर्स कॉक प्रोजेक्ट पर किए गए प्रयोगों से पता चलता है कि यह मौजूदा एलएलएम-आधारित और गैर-एलएलएम उपकरणों से बेहतर प्रदर्शन करता है, जिसकी औसत लागत $1.25 है और इसमें 14.7 मिनट लगते हैं। यह उपयोगकर्ताओं या अन्य उपकरणों से आंशिक प्रमाण संरचनाएँ या संबंधित लेम्मा भी स्वीकार कर सकता है, और 58% तक प्रमेयों को सिद्ध कर सकता है।

Takeaways, Limitations

Takeaways:
एलएलएम की अशुद्धि के बावजूद, हम प्रदर्शित करते हैं कि फूट डालो और जीतो रणनीतियों और आंशिक प्रगति शोषण का उपयोग करके औपचारिक सत्यापन को प्रभावी ढंग से स्वचालित किया जा सकता है।
यह मौजूदा एलएलएम-आधारित और गैर-एलएलएम-आधारित उपकरणों की तुलना में बेहतर प्रदर्शन प्राप्त करता है।
उपयोगकर्ता इनपुट या अन्य उपकरणों से प्राप्त आउटपुट का लाभ उठाकर प्रूफ प्रक्रिया में सुधार किया जा सकता है।
यह लागत प्रभावी है और व्यावहारिक समय सीमा के भीतर प्रमाण प्रस्तुत करता है।
Limitations:
चूंकि ये एक विशिष्ट कॉक परियोजना के लिए मूल्यांकन परिणाम हैं, इसलिए उनकी सामान्यता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
सभी प्रमेयों को सिद्ध नहीं किया जा सकता, तथा सिद्ध किये जा सकने वाले प्रमेयों का अनुपात अभी भी सीमित है।
चूंकि यह एलएलएम के प्रदर्शन पर निर्भर करता है, इसलिए एलएलएम के विकास के साथ इसके प्रदर्शन में उतार-चढ़ाव हो सकता है।
👍