दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

अपोलो: उन्नत औपचारिक तर्क के लिए स्वचालित एलएलएम और लीन सहयोग

Created by
  • Haebom

लेखक

अज़ीम ओस्पानोव, फ़रज़ान फ़ार्निया, रूज़बेह युसुफ़ज़ादेह

रूपरेखा

अपोलो एक स्वचालित प्रमेय सिद्धि प्रणाली है जो गणितीय प्रमेयों को सिद्ध करने के लिए लीन कंपाइलर और एलएलएम की तर्क शक्ति का संयोजन करती है। जहाँ पारंपरिक एलएलएम-आधारित प्रमेय सिद्धि विधियाँ ऐसे प्रमाण उत्पन्न करती हैं जो सत्यापन प्रणालियों द्वारा असंख्य (हज़ारों) प्रतिचयनों से होकर गुजरते हैं, वहीं अपोलो एक मॉड्यूलर पाइपलाइन का उपयोग करता है जिसमें एलएलएम प्रमाण उत्पन्न करता है, एजेंट प्रमाणों में वाक्यगत त्रुटियों को ठीक करते हैं, लीन त्रुटियों की पहचान करता है, असफल उप-प्रमेयों को अलग करता है, एक स्वचालित सॉल्वर का उपयोग करता है, और शेष उद्देश्यों के लिए कम खर्च में एलएलएम का उपयोग करता है। सुधारे गए उप-प्रमाणों के पुनर्संयोजन और पुनर्सत्यापन की यह प्रक्रिया उपयोगकर्ता द्वारा नियंत्रित अधिकतम प्रयासों तक दोहराई जाती है। मिनीएफ2एफ बेंचमार्क पर, यह 8B से कम प्राचलों वाले मॉडलों में 84.9% सटीकता प्राप्त करता है, जबकि प्रतिचयन लागत 100 से कम बनाए रखता है। इसके अलावा, यह गोएडेलप्रोवरएसएफटी की सटीकता को 65.6% तक सुधारता है और प्रतिदर्श जटिलता को 25,600 से घटाकर कई सौ कर देता है।

Takeaways, Limitations

Takeaways:
हम यह प्रदर्शित करते हैं कि एलएलएम आउटपुट में लक्षित कंपाइलर गाइड संशोधनों से दक्षता और सटीकता में उल्लेखनीय सुधार होता है।
स्वचालित प्रमेय सिद्धि के लिए एक मापनीय सामान्य प्रतिमान प्रस्तुत करना।
कम नमूना लागत पर उच्च सटीकता प्राप्त की गई (मिनीएफ2एफ बेंचमार्क पर 84.9%, गोएडेलप्रोवरएसएफटी पर 65.6%)।
सामान्य प्रयोजन मॉडलों की सटीकता में उल्लेखनीय सुधार हुआ (3-7% से 40% से अधिक)।
Limitations:
वर्तमान में, केवल विशिष्ट बेंचमार्क (मिनीएफ2एफ, गोएडेलप्रोवरएसएफटी) के लिए प्रदर्शन प्रस्तुत किया गया है, तथा अन्य बेंचमार्क या अधिक जटिल प्रमेयों के लिए सामान्यीकरण हेतु और अधिक शोध की आवश्यकता है।
अपोलो का प्रदर्शन प्रयुक्त एलएलएम और लीन कंपाइलर्स पर निर्भर करता है, तथा अन्य प्रणालियों के साथ इसकी अनुकूलता और पोर्टेबिलिटी पर और अधिक शोध की आवश्यकता है।
पैरामीटर अनुकूलन पर और अधिक शोध की आवश्यकता है, जैसे कि उपयोगकर्ता द्वारा नियंत्रित प्रयासों की अधिकतम संख्या निर्धारित करना।
👍