दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

डिस्कॉर्ड: रेक्टिफाइड फ्लो डिकोडिंग के माध्यम से असतत टोकन से निरंतर गति तक

Created by
  • Haebom

लेखक

जुंगबिन चो, जुनवान किम, जिसू किम, मिनसेओ किम, मिंगु कांग, सुंगयुन होंग, ताए-ह्यून ओह, यंगजे यू

रूपरेखा

यह शोधपत्र एक नवीन विधि, "रेक्टिफाइड फ्लो डिकोडिंग (DisCoRD)" प्रस्तुत करता है। यह विधि, डिस्क्रीट टोकन्स टू कंटीन्यूअस मोशन वाया रेक्टिफाइड फ्लो डिकोडिंग (DisCoRD) के माध्यम से, डिस्क्रीट और कंटीन्यूअस मोशन रिप्रेजेंटेशन के बीच के अंतरों को समझने के लिए डिज़ाइन की गई है। यह विधि, डिस्क्रीट मोशन टोकन्स को एक कंटीन्यूअस रॉ मोशन स्पेस में डिकोड करने के लिए रेक्टिफाइड फ्लो का उपयोग करती है। मौजूदा डिस्क्रीट जनरेशन विधियों की सीमित अभिव्यंजना और फ्रेम-स्तरीय नॉइज़ आर्टिफैक्ट्स, साथ ही कंडीशनल सिग्नल्स के अनुपालन में कंटीन्यूअस तरीकों की कठिनाई को दूर करने के लिए, हम टोकन डिकोडिंग को एक कंडीशनल जनरेशन कार्य के रूप में संरचित करते हैं ताकि सूक्ष्म गतियों को पकड़ा जा सके और अधिक सहज, अधिक प्राकृतिक गति उत्पन्न की जा सके। हम विभिन्न सेटिंग्स में कंडीशनल सिग्नल्स के प्रति निष्ठा बनाए रखते हुए स्वाभाविकता को बढ़ाते हैं, जिससे ह्यूमनएमएल3डी और किट-एमएल डेटासेट पर अत्याधुनिक प्रदर्शन (क्रमशः FID 0.032 और 0.169) प्राप्त होता है।

Takeaways, Limitations

Takeaways:
यह पृथक अभ्यावेदन की दक्षता को सतत अभ्यावेदन की यथार्थवादिता के साथ संयोजित करके मानव गति निर्माण के लिए एक नया मानक स्थापित करता है।
संशोधित प्रवाह का उपयोग करने वाली टोकन डिकोडिंग तकनीकें विभिन्न असतत-आधारित फ्रेमवर्क के साथ संगत हैं।
हम ह्यूमनएमएल3डी और किट-एमएल डेटासेट पर अत्याधुनिक प्रदर्शन प्राप्त करके अपनी पद्धति की श्रेष्ठता प्रदर्शित करते हैं।
यह अधिक प्राकृतिक और सहज गति सृजन की अनुमति देता है।
Limitations:
इस पत्र में प्रस्तुत विधि के सामान्यीकरण प्रदर्शन का मूल्यांकन करने के लिए आगे अनुसंधान की आवश्यकता है।
अन्य गति डेटासेट पर प्रदर्शन मूल्यांकन आवश्यक है।
स्थिर प्रवाह की गणना लागत अधिक हो सकती है।
बहुत बड़े डेटासेट पर इसकी प्रयोज्यता के सत्यापन की आवश्यकता है।
👍