दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

केवल-पाठ्य तर्क शून्य-शॉट बहुविध मूल्यांकनकर्ताओं को मुक्त करता है

Created by
  • Haebom

लेखक

जोंगवू को, सुंगन्युन किम, सुंगवू चो, से-यंग युन

रूपरेखा

यह शोधपत्र मानव-जनित पुरस्कार संकेतों पर केंद्रित है, जो जनरेटिव मॉडलों को मानवीय प्राथमिकताओं के साथ संरेखित करने में महत्वपूर्ण भूमिका निभाते हैं। एलएलएम-एज़-ए-जज दृष्टिकोण, जो एलएलएम को मूल्यांकनकर्ता के रूप में उपयोग करते हैं, मैन्युअल एनोटेशन की लागत को काफी कम कर देते हैं, लेकिन आमतौर पर व्यापक मोडैलिटी-विशिष्ट प्रशिक्षण डेटा की आवश्यकता होती है और विविध मल्टीमोडैलिटी कार्यों में सामान्यीकरण की कमी होती है। इस शोधपत्र में, हम फ्लेक्स-जज का प्रस्ताव करते हैं, जो एक अनुमान-आधारित मल्टीमोडैलिटी निर्णय मॉडल है जो न्यूनतम पाठ अनुमान डेटा का उपयोग करके कई मोडैलिटी और मूल्यांकन प्रारूपों में मजबूती से सामान्यीकरण करता है। मूल विचार यह है कि संरचित पाठ अनुमान स्पष्टीकरण स्वाभाविक रूप से सामान्यीकरण योग्य निर्णय पैटर्न को अंतर्निहित करते हैं, जिससे छवियों और वीडियो जैसे मल्टीमोडैलिटी निर्णयों में प्रभावी स्थानांतरण संभव होता है। प्रायोगिक परिणाम दर्शाते हैं कि फ्लेक्स-जज, काफी कम पाठ डेटा के साथ प्रशिक्षित होने के बावजूद, अत्याधुनिक वाणिज्यिक एपीआई और व्यापक रूप से प्रशिक्षित मल्टीमोडैलिटी मूल्यांकनकर्ताओं की तुलना में प्रतिस्पर्धी या बेहतर प्रदर्शन प्राप्त करता है। यह खोज विशेष रूप से अणुओं जैसे मोडैलिटी के लिए प्रासंगिक है, जहाँ व्यापक मूल्यांकन मानकों का अभाव है, जो संसाधन-सीमित क्षेत्रों में इसके व्यावहारिक मूल्य को उजागर करता है। यह अध्ययन अनुमान-आधारित पाठ पर्यवेक्षण को मौजूदा एनोटेशन-गहन दृष्टिकोणों के लिए एक शक्तिशाली और लागत प्रभावी विकल्प के रूप में प्रस्तुत करके स्केलेबल मल्टीमॉडलिटी मॉडल-ए-जज को महत्वपूर्ण रूप से आगे बढ़ाता है।

Takeaways, Limitations

Takeaways:
हम एक बहु-मोडैलिटी निर्णय मॉडल (फ्लेक्स-जज) प्रस्तुत करते हैं जो न्यूनतम पाठ डेटा का उपयोग करके विभिन्न मोडैलिटीज में सामान्यीकरण करता है।
मौजूदा वाणिज्यिक एपीआई और व्यापक रूप से प्रशिक्षित बहु-मॉडल मूल्यांकनकर्ताओं की तुलना में प्रतिस्पर्धी प्रदर्शन प्राप्त करता है।
यह संसाधन-विवश क्षेत्रों (जैसे आणविक तौर-तरीके) में उच्च व्यावहारिक उपयोगिता दर्शाता है।
अनुमान-आधारित पाठ पर्यवेक्षण की प्रभावशीलता का प्रदर्शन करना और निर्णायक के रूप में मापनीय बहु-मोडैलिटी मॉडल के विकास में योगदान देना।
Limitations:
प्रस्तावित मॉडल के सामान्यीकरण प्रदर्शन का आगे सत्यापन आवश्यक है।
विभिन्न तौर-तरीकों और मूल्यांकन प्रारूपों में सामान्यीकरण की सीमाओं को दूर करने के लिए आगे अनुसंधान की आवश्यकता है।
विशिष्ट तौर-तरीकों के लिए संभावित डेटा पूर्वाग्रह।
गुणवत्ता और मात्रा पर अनुमान-आधारित पाठ डेटा की निर्भरता।
👍