दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ऊष्मा प्रसार मॉडल -- अंतरपिक्सल ध्यान तंत्र

Created by
  • Haebom

लेखक

पेंगफेई झांग, शौकिंग जिया

रूपरेखा

यह शोधपत्र ऊष्मा विसरण मॉडल (HDM) का प्रस्ताव करता है, जो एक नवीन विसरण संभाव्यता मॉडल है जो पिक्सेल के बीच संबंधों पर विचार करके अधिक यथार्थवादी चित्र उत्पन्न करता है। जहाँ मौजूदा शोर-निरोधक विसरण संभाव्यता मॉडल (DDPM) संपूर्ण चित्र को संसाधित करते हैं, वहीं HDM पिक्सेल के बीच एक अवधान तंत्र को सम्मिलित करता है, इस तथ्य का लाभ उठाते हुए कि आसन्न पिक्सेल के एक ही वस्तु से संबंधित होने की अधिक संभावना होती है। द्वि-आयामी ऊष्मा समीकरण के विविक्त रूप को DDPM के विसरण और जनरेटिव सूत्रों में समाहित करके, HDM चित्र प्रसंस्करण के दौरान आसन्न पिक्सेल के बीच संबंधों की गणना करता है। प्रायोगिक परिणाम दर्शाते हैं कि HDM, DDPM, सुसंगत विसरण मॉडल (CDM), सुप्त विसरण मॉडल (LDM), और वेक्टर क्वांटाइज्ड जनरेटिव एडवर्सेरियल नेटवर्क (VQGAN) जैसे मौजूदा मॉडलों की तुलना में उच्च-गुणवत्ता वाले नमूने उत्पन्न करता है।

Takeaways, Limitations

Takeaways:
हम पिक्सल के बीच स्थानिक संबंध पर विचार करके छवि निर्माण की गुणवत्ता में सुधार करने के लिए एक नवीन विधि प्रस्तुत करते हैं।
प्रायोगिक तौर पर सिद्ध हो चुका है कि एचडीएम, डीडीपीएम, सीडीएम, एलडीएम और वीक्यूजीएएन जैसे मौजूदा मॉडलों से बेहतर प्रदर्शन करता है।
उच्च गुणवत्ता वाली छवि निर्माण के लिए नई संभावनाएं खोलना।
Limitations:
प्रस्तावित मॉडल की कम्प्यूटेशनल जटिलता और दक्षता के विश्लेषण का अभाव।
विविध छवि डेटासेट पर सामान्यीकरण प्रदर्शन मूल्यांकन का अभाव।
मॉडल की सीखने की प्रक्रिया और हाइपरपैरामीटर अनुकूलन के विस्तृत स्पष्टीकरण का अभाव।
👍