[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

प्राकृतिक भाषा संकेतों से एलएलएम-जनित कोड के औपचारिक सत्यापन की ओर

Created by
  • Haebom

लेखक

एरोन काउंसिलमैन, डेविड फू, आर्यन गुप्ता, चेंगक्सियाओ वांग, डेविड ग्रोव, यू-जिओंग वांग, विक्रम एडवे

रूपरेखा

इस पत्र में, हम एस्ट्रोगेटर का प्रस्ताव करते हैं, एक ऐसी प्रणाली जो उपयोगकर्ता के इरादे को स्पष्ट करने और उत्पन्न कोड की शुद्धता को सत्यापित करने के लिए एक औपचारिक क्वेरी भाषा का परिचय देती है, जिससे प्राकृतिक भाषा विवरणों के आधार पर कोड उत्पन्न करने वाले बड़े पैमाने के भाषा मॉडल (एलएलएम) की त्रुटि समस्या का समाधान होता है। एस्ट्रोगेटर, एन्सिबल प्रोग्रामिंग भाषा पर आधारित है और इसमें एक औपचारिक क्वेरी भाषा, एक कम्प्यूटेशनल विधि जो एन्सिबल प्रोग्राम व्यवहार का प्रतिनिधित्व करती है, और सत्यापन के लिए प्रयुक्त एक प्रतीकात्मक दुभाषिया शामिल है। 21 कोड निर्माण कार्यों के एक बेंचमार्क में, 83% मामलों में सही कोड सत्यापित किया गया और 92% मामलों में गलत कोड की पहचान की गई।

Takeaways, Limitations

Takeaways:
हम एलएलएम-आधारित कोड जेनरेशन की सटीकता में सुधार करने के लिए एक नया दृष्टिकोण प्रस्तुत करते हैं।
औपचारिक सत्यापन आपको यह जांचने की अनुमति देता है कि उपयोगकर्ता का इरादा उत्पन्न कोड से मेल खाता है या नहीं।
सीमित प्रोग्रामिंग ज्ञान वाले उपयोगकर्ताओं के लिए भी प्राकृतिक भाषा प्रोग्रामिंग को सक्षम करने की क्षमता।
एन्सिबल जैसी विशिष्ट भाषाओं के लिए कोड निर्माण और सत्यापन की दक्षता में वृद्धि।
Limitations:
एस्ट्रोगेटर विशिष्ट रूप से एन्सिबल भाषा के लिए है तथा अन्य प्रोग्रामिंग भाषाओं में इसकी विस्तारशीलता सीमित हो सकती है।
बेंचमार्क का आकार अपेक्षाकृत छोटा है, जिसके सामान्यीकरण पर और अधिक शोध की आवश्यकता है।
औपचारिक क्वेरी भाषाओं के उपयोग में आसानी और सीखने की लागत पर विचार किया जाना चाहिए।
यह सभी प्रकार की कोड त्रुटियों का पूरी तरह से पता नहीं लगा सकता (83% सटीकता, 92% सटीकता का मतलब पूर्ण सटीकता नहीं है)।
👍