दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

संपूर्ण प्रसार पथ को सूक्ष्म मानवीय वरीयता के साथ सीधे संरेखित करना

Created by
  • Haebom

लेखक

ज़ियांगवेई शेन, झिमिन ली, झांताओ यांग, शियी झांग, यिंगफैंग झांग, डोंगहाओ ली, चुन्यु वांग, किंगलिन लू, यानसॉन्ग तांग

रूपरेखा

यह शोधपत्र दो प्रमुख चुनौतियों का समाधान करने के लिए एक नवीन विधि, डायरेक्ट-एलाइन, प्रस्तावित करता है: विसरण मॉडल को मानवीय प्राथमिकताओं के साथ सीधे संरेखित करने वाली मौजूदा विधियों की गणना लागत और निरंतर ऑफ़लाइन क्षतिपूर्ति मॉडल अनुकूलन की आवश्यकता। डायरेक्ट-एलाइन एक शोर शब्दकोश परिभाषित करके और प्रक्षेप के माध्यम से सभी समय चरणों में मूल छवि को प्रभावी ढंग से पुनर्प्राप्त करके बहु-चरणीय शोर-निवारण प्रक्रिया की गणना लागत को कम करता है। इसके अलावा, यह सिमेंटिक रिलेटिव प्रेफरेंस ऑप्टिमाइज़ेशन (SRPO) का परिचय देता है, जो क्षतिपूर्ति के रूप में टेक्स्ट-कंडीशनल संकेतों का उपयोग करता है। यह सकारात्मक और नकारात्मक प्रॉम्प्ट सुदृढीकरण के आधार पर ऑनलाइन क्षतिपूर्ति को समायोजित करके ऑफ़लाइन क्षतिपूर्ति फ़ाइन-ट्यूनिंग पर निर्भरता को कम करता है। परिणामस्वरूप, FLUX मॉडल को फ़ाइन-ट्यूनिंग करने से मानव मूल्यांकन मानदंडों की यथार्थवादिता और सौंदर्य गुणवत्ता में तीन गुना से भी अधिक सुधार होता है।

Takeaways, Limitations

Takeaways:
बहु-चरणीय शोर-निरोधन प्रक्रिया की कम्प्यूटेशनल लागत समस्या को प्रभावी ढंग से हल करने के लिए एक नई विधि (डायरेक्ट-एलाइन) प्रस्तुत की गई है।
हम एक ऑनलाइन मुआवजा समायोजन विधि (एसआरपीओ) प्रस्तुत करते हैं जो ऑफलाइन मुआवजा मॉडल को बेहतर बनाने पर निर्भरता को कम करता है।
फ्लक्स मॉडल की यथार्थवादिता और सौंदर्य गुणवत्ता में महत्वपूर्ण सुधार होता है।
Limitations:
प्रस्तावित विधि के सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।
चूंकि परिणाम एक विशिष्ट मॉडल (FLUX) के लिए हैं, इसलिए अन्य प्रसार मॉडलों पर प्रयोज्यता का सत्यापन आवश्यक है।
पाठ-सशर्त संकेतों पर SRPO की उच्च निर्भरता, पाठ विवरण की गुणवत्ता के आधार पर इसके प्रदर्शन को प्रभावित कर सकती है।
👍