दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

प्रोरिफाइन: पाठ्य फीडबैक के साथ अनुमान-समय संकेत परिशोधन

Created by
  • Haebom

लेखक

दीपक पंडिता, थारिन्दु सिरिल वीरासूर्या, अंकित पराग शाह, इसाबेल डायना मे-शिन एनजी, क्रिस्टोफर एम. होमन, वेई वेई

रूपरेखा

यह शोधपत्र एजेंट वर्कफ़्लो पर केंद्रित है, जहाँ कई AI एजेंट जटिल कार्य (जैसे, तर्क, योजना, आदि) करते हैं। इन वर्कफ़्लो का प्रदर्शन काफी हद तक उन संकेतों पर निर्भर करता है जो प्रत्येक एजेंट की भूमिका का मार्गदर्शन करते हैं, और गलत संकेत समग्र सिस्टम प्रदर्शन को ख़राब कर सकते हैं। इस समस्या के समाधान के लिए, हम एक नवीन अनुमान समय अनुकूलन विधि, प्रोरिफाइन, प्रस्तुत करते हैं। प्रोरिफाइन, बिना किसी अतिरिक्त प्रशिक्षण या सही लेबलिंग की आवश्यकता के, LLM एजेंटों के एक लूप के माध्यम से पाठ्य फ़ीडबैक उत्पन्न और लागू करके बहु-चरण अनुमान कार्यों के लिए संकेतों को गतिशील रूप से बेहतर बनाता है। पाँच गणितीय अनुमान बेंचमार्क डेटासेट पर, प्रोरिफाइन एक ज़ीरो-शॉट चेन-ऑफ-थॉट बेसलाइन मॉडल से 3-37% बेहतर प्रदर्शन करता है, और छोटे मॉडलों के प्रदर्शन को बड़े मॉडलों के प्रदर्शन के बराबर बढ़ाने में अपनी प्रभावशीलता भी प्रदर्शित करता है। यह लागत-प्रभावी और शक्तिशाली हाइब्रिड AI प्रणालियों के निर्माण और उच्च-प्रदर्शन AI की पहुँच में सुधार करने में इसके योगदान की क्षमता का संकेत देता है।

Takeaways, Limitations

Takeaways:
प्रोरिफाइन, अनुमान समय संकेतों को अनुकूलित करने के लिए एक प्रभावी विधि, प्रस्तुत की गई है।
शून्य-शॉट चेन-ऑफ-थॉट बेसलाइन मॉडल की तुलना में प्रदर्शन में सुधार (3-37%p)
छोटे मॉडलों के प्रदर्शन में सुधार लाने और लागत प्रभावी एआई प्रणालियों के निर्माण की संभावना का सुझाव देना।
उच्च-प्रदर्शन AI तक पहुँच में सुधार करने में योगदान
Limitations:
प्रस्तुत बेंचमार्क डेटासेट गणितीय अनुमान तक सीमित है। अन्य प्रकार के कार्यों के लिए इसकी सामान्यता की पुष्टि की जानी आवश्यक है।
ऐसी संभावना है कि प्रोरिफाइन का प्रदर्शन लाभ विशिष्ट डेटासेट या कार्यों के प्रति पक्षपाती हो सकता है।
एलएलएम एजेंट लूप की जटिलता और कम्प्यूटेशनल लागत के विश्लेषण का अभाव।
वास्तविक दुनिया के अनुप्रयोगों में मापनीयता और स्थिरता पर और अधिक शोध की आवश्यकता है।
👍