दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

स्मार्ट-एडिटर: संरचनात्मक अखंडता के साथ मानव-सदृश डिज़ाइन संपादन के लिए एक बहु-एजेंट फ्रेमवर्क

Created by
  • Haebom

लेखक

इशानी मंडल, मीरा भारद्वाज, आयुष रॉय, अपर्णा गैरिमेला, जॉर्डन ली बॉयड-ग्रेबर

रूपरेखा

स्मार्ट-एडिटर संरचित (पोस्टर, वेबसाइट) और असंरचित (प्राकृतिक छवि) दोनों क्षेत्रों में रचनात्मक लेआउट और सामग्री संपादन के लिए एक ढाँचा है। स्थानीय संपादन करने वाले मौजूदा मॉडलों के विपरीत, स्मार्ट-एडिटर दो रणनीतियों के माध्यम से वैश्विक संगति बनाए रखता है: रिवॉर्ड-रिफाइन, एक अनुमान-समय पुरस्कार-निर्देशित परिशोधन विधि, और रिवॉर्डडीपीओ, एक प्रशिक्षण-समय वरीयता अनुकूलन दृष्टिकोण जो पुरस्कार-संरेखित लेआउट युग्मों का उपयोग करता है। मॉडल के प्रदर्शन का मूल्यांकन करने के लिए, हम स्मार्टएडिट-बेंच प्रस्तुत करते हैं, जो एक बेंचमार्क है जो बहु-डोमेन, कैस्केडिंग संपादन परिदृश्यों को समाहित करता है। स्मार्ट-एडिटर, इंस्ट्रक्टपिक्स2पिक्स और हाइव जैसे मज़बूत आधारभूत मॉडलों से बेहतर प्रदर्शन करता है, जहाँ रिवॉर्डडीपीओ संरचित सेटिंग्स में 15% तक प्रदर्शन लाभ प्राप्त करता है, और रिवॉर्ड-रिफाइन प्राकृतिक छवियों पर अपनी श्रेष्ठता प्रदर्शित करता है। स्वचालित और मानवीय मूल्यांकन, अर्थपूर्ण रूप से सुसंगत और दृश्य रूप से संरेखित संपादन उत्पन्न करने में पुरस्कार-आधारित योजनाओं के मूल्य की पुष्टि करते हैं।

Takeaways, Limitations

Takeaways:
यह संरचित और असंरचित दोनों क्षेत्रों में रचनात्मक लेआउट और सामग्री संपादन के लिए एक प्रभावी ढांचा प्रस्तुत करता है।
यह वैश्विक स्थिरता बनाए रखता है और दो रणनीतियों के माध्यम से उच्च गुणवत्ता वाले संपादन परिणाम उत्पन्न करता है: रिवार्ड-रिफाइन और रिवार्डडीपीओ।
हम एक नया बेंचमार्क, SMARTEdit-Bench प्रदान करते हैं, जिसमें बहु-डोमेन, कैस्केडिंग संपादन परिदृश्य शामिल हैं।
यह मौजूदा मॉडलों से बेहतर प्रदर्शन करता है, और विशेष रूप से रिवार्डडीपीओ संरचित सेटिंग्स में महत्वपूर्ण प्रदर्शन सुधार दिखाता है।
हम प्रयोगात्मक रूप से पुरस्कार-आधारित योजना के महत्व को प्रदर्शित करते हैं।
Limitations:
स्मार्टएडिट-बेंच के पैमाने और विविधता पर आगे अनुसंधान की आवश्यकता हो सकती है।
कुछ प्रकार के संपादनों या डोमेन के लिए प्रदर्शन सीमित हो सकता है।
रिवॉर्ड-रिफाइन और रिवॉर्डडीपीओ की परस्पर क्रिया और अनुकूलन को निर्धारित करने के लिए आगे के विश्लेषण की आवश्यकता हो सकती है।
विभिन्न संपादन प्रकारों के लिए सामान्यीकरण प्रदर्शन और मजबूती पर आगे अनुसंधान की आवश्यकता है।
👍