दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

FRIDA बचाव के लिए! आपदा प्रतिक्रिया के लिए वस्तु-आधारित सामान्य ज्ञान तर्क में सिंथेटिक डेटा की प्रभावशीलता का विश्लेषण

Created by
  • Haebom

लेखक

मोली शिचमैन, क्लेयर बोनियल, ऑस्टिन ब्लोडगेट, टेलर हडसन, फ्रांसिस फेरारो, रेचल रुडिंगर

रूपरेखा

यह शोधपत्र आपदा राहत स्थितियों में मानव-रोबोट अंतःक्रिया (HRI) के लिए बड़े पैमाने के भाषा मॉडल (LLM) की भौतिक तर्क क्षमताओं का लाभ उठाने की क्षमता प्रस्तुत करता है। मौजूदा बड़े LLM की आकार संबंधी सीमाओं को दूर करने के लिए, हम एक फील्ड रीजनिंग और इंस्ट्रक्शन डिकोडिंग एजेंट (FRIDA) मॉडल बनाने हेतु एक डेटासेट और पाइपलाइन प्रस्तावित करते हैं। क्षेत्र विशेषज्ञों और भाषाविदों के ज्ञान को मिलाकर, हम उच्च-गुणवत्ता वाले, कम-शॉट प्रॉम्प्ट उत्पन्न करते हैं, जिनका उपयोग सिंथेटिक डेटा का उपयोग करके एक छोटे, निर्देश-संयोजित मॉडल को परिष्कृत करने के लिए किया जाता है। हम प्रयोगात्मक रूप से प्रदर्शित करते हैं कि केवल वस्तु की भौतिक स्थिति और विशेषता डेटा पर प्रशिक्षित एक FRIDA मॉडल, पूरी तरह से सिंथेटिक डेटा और बेसलाइन मॉडल पर प्रशिक्षित मॉडलों से बेहतर प्रदर्शन करता है, जिससे न्यूनतम डेटा के साथ भौतिक सामान्य ज्ञान को स्थापित करने की क्षमता प्रदर्शित होती है।

____T228290_____, ____T228291_____

Takeaways:
आपदा राहत रोबोटों को भौतिक तर्क क्षमता से सशक्त बनाने के लिए छोटे एलएलएम का उपयोग करने की संभावना का सुझाव दिया गया।
डोमेन विशेषज्ञों और भाषाविदों के बीच सहयोग के माध्यम से उच्च गुणवत्ता वाले डेटा उत्पन्न करने और कुशल मॉडलों को प्रशिक्षित करने के लिए एक विधि प्रस्तुत करना।
हम बताते हैं कि वस्तुओं की भौतिक स्थिति और कार्यात्मक डेटा भौतिक अनुमान प्रदर्शन को बेहतर बनाने में महत्वपूर्ण कारक हैं।
हम यह प्रदर्शित करते हैं कि न्यूनतम डेटा के साथ प्रभावी एलएलएम फाइन-ट्यूनिंग संभव है।
Limitations:
वर्तमान में प्रस्तावित FRIDA पाइपलाइन के सामान्यीकरण प्रदर्शन और विभिन्न आपदा स्थितियों में इसकी प्रयोज्यता का मूल्यांकन करने के लिए आगे अनुसंधान की आवश्यकता है।
प्रयुक्त सिंथेटिक डेटा की गुणवत्ता और मात्रा में सीमाओं के कारण संभावित प्रदर्शन में गिरावट।
वास्तविक आपदा परिवेश में प्रायोगिक सत्यापन का अभाव।
अधिक विविध और जटिल शारीरिक तर्क कार्यों के लिए प्रदर्शन मूल्यांकन की आवश्यकता होती है।
👍