दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

COEF-VQ: कैस्केडेड मल्टीमॉडल LLM फ्रेमवर्क के माध्यम से लागत-कुशल वीडियो गुणवत्ता की समझ

Created by
  • Haebom

लेखक

शिन डोंग, सेन जिया, मिंग रुई वांग, यान ली, झेन्हेंग यांग, बिंगफेंग डेंग, होंगयु जिओंग

रूपरेखा

इस शोधपत्र में, हम COEF-VQ का प्रस्ताव करते हैं, जो मल्टीमॉडल लार्ज-स्केल लैंग्वेज मॉडल (MLLM) का उपयोग करके वीडियो गुणवत्ता को समझने के लिए एक नया कैस्केड फ्रेमवर्क है। COEF-VQ एंट्रॉपी-आधारित प्री-फ़िल्टरिंग चरण के माध्यम से उच्च-अनिश्चितता वाले नमूनों का तरजीही विश्लेषण करके MLLM के मजबूत वर्गीकरण प्रदर्शन को बनाए रखते हुए GPU के उपयोग को काफी कम करता है। हम अपने वीडियो प्रबंधन प्लेटफ़ॉर्म (VMP), एक लघु-वीडियो प्लेटफ़ॉर्म पर COEF-VQ को तैनात करते हैं, और वीडियो गुणवत्ता को समझने से संबंधित दो इन-हाउस कार्यों पर प्रयोग करते हैं। परिणाम ऑफ़लाइन मूल्यांकन में महत्वपूर्ण प्रदर्शन सुधार दिखाते हैं और प्लेटफ़ॉर्म स्थिरता को प्रभावी ढंग से बढ़ाते हैं, जैसे कि ऑनलाइन A/B परीक्षणों में अनुपयुक्त सामग्री वाले वीडियो की दर्शकों की संख्या में 9.9% की कमी। पोस्ट-रिलीज़ मॉनिटरिंग के माध्यम से निरंतर प्रदर्शन सुधारों की पुष्टि की गई है।

Takeaways, Limitations

Takeaways:
हम एक नया कैस्केड फ्रेमवर्क प्रस्तुत करते हैं जो MLLM की उच्च GPU संसाधन आवश्यकताओं को प्रभावी ढंग से संबोधित करता है।
एन्ट्रॉपी-आधारित प्री-फ़िल्टरिंग वर्गीकरण प्रदर्शन को बनाए रखते हुए कम्प्यूटेशनल दक्षता में महत्वपूर्ण सुधार करती है।
इसे वास्तविक लघु वीडियो प्लेटफार्मों पर लागू करना, अनुचित सामग्री को कम करने और प्लेटफ़ॉर्म सुरक्षा में सुधार करने में योगदान देना।
ऑनलाइन ए/बी परीक्षण के माध्यम से वास्तविक वातावरण में प्रभावशीलता को सत्यापित करें।
Limitations:
प्रस्तावित फ्रेमवर्क का प्रदर्शन प्रयुक्त एमएलएलएम और प्री-फ़िल्टरिंग मॉडल के प्रदर्शन पर निर्भर हो सकता है।
इस पेपर में प्रयुक्त दो इन-हाउस कार्यों के अलावा अन्य कार्यों के सामान्यीकरण प्रदर्शन पर आगे अध्ययन की आवश्यकता है।
एन्ट्रॉपी-आधारित प्रीफ़िल्टरिंग के लिए इष्टतम पैरामीटर निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता हो सकती है।
आंतरिक डेटा पर निर्भरता के कारण, अन्य प्लेटफार्मों या डेटासेटों पर सामान्यीकरण की पुष्टि आवश्यक है।
👍