[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एक्शनस्टूडियो: बड़े एक्शन मॉडल के डेटा और प्रशिक्षण के लिए एक हल्का फ्रेमवर्क

Created by
  • Haebom

लेखक

जियांगुओ झांग, थाई होआंग, मिंग झू, ज़क्सिन लियू, शियू वांग, तुलिका अवलगांवकर, अक्षरा प्रभाकर, हाओलिन चेन, वीरान याओ, झिवेई लियू, जुंताओ टैन, जुआन कार्लोस नीबल्स, शेल्बी हेनेके, हुआन वांग, सिल्वियो सावरेसे, कैमिंग जिओंग

रूपरेखा

एक्शनस्टूडियो बड़े एक्शन मॉडल सीखने के लिए एक हल्का, स्केलेबल डेटा और प्रशिक्षण ढाँचा है। इसे विविध एजेंट परिवेशों और शोरयुक्त एजेंट डेटा की जटिलता के कारण बड़े एक्शन मॉडल सीखने की कठिनाइयों को दूर करने के लिए प्रस्तावित किया गया है। एक्शनस्टूडियो प्रस्तावित यूनिफाइड फॉर्मेट 2.0 का उपयोग करके विविध एजेंट ट्रैजेक्टरीज़ को एकीकृत करता है, अनुकूलित मल्टी-नोड वितरित सेटिंग्स के माध्यम से विविध प्रशिक्षण वर्कफ़्लो का समर्थन करता है, और शक्तिशाली प्रीप्रोसेसिंग और रीयल-टाइम सत्यापन टूल को एकीकृत करता है। यह मौजूदा एजेंट प्रशिक्षण ढाँचों की तुलना में 9 गुना अधिक थ्रूपुट प्राप्त करता है, और प्रशिक्षित मॉडल सार्वजनिक और यथार्थवादी एजेंट बेंचमार्क पर अत्याधुनिक प्रदर्शन प्राप्त करते हैं। हम एक्शनस्टूडियो ढाँचे और एक्शनस्टूडियो-98k डेटासेट को ओपन-सोर्स करते हैं, जिसमें 98,000 उच्च-गुणवत्ता वाले ट्रैजेक्टरीज़ शामिल हैं।

Takeaways, Limitations

Takeaways:
बड़े पैमाने पर व्यवहार मॉडल सीखने की दक्षता में उल्लेखनीय सुधार (9x तक सुधार)।
विविध एजेंट डेटा को एकीकृत और संसाधित करने के लिए एक मानकीकृत तरीका प्रदान करता है।
यह एक मापनीय और लचीला प्रशिक्षण ढांचा प्रदान करके अनुसंधान में प्रवेश की बाधा को कम करता है।
उच्च गुणवत्ता वाले, बड़े पैमाने के डेटासेट जारी करके अनुसंधान का समर्थन करें।
विभिन्न प्रशिक्षण कार्यप्रवाहों और अनुकूलित बहु-नोड वितरित सेटअपों के लिए समर्थन।
शक्तिशाली प्रीप्रोसेसिंग और वास्तविक समय सत्यापन उपकरणों का एकीकरण।
Limitations:
एकीकृत प्रारूप 2.0 की सार्वभौमिकता और दीर्घकालिक अनुकूलता का सत्यापन आवश्यक है।
यह निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है कि क्या एक्शनस्टूडियो के प्रदर्शन सुधार सभी प्रकार के एजेंटों और कार्यों के लिए सामान्यीकृत हैं।
एक्शनस्टूडियो-98k डेटासेट की विविधता और प्रतिनिधित्वशीलता का आगे विश्लेषण आवश्यक है।
विशिष्ट एजेंट वातावरण के लिए अनुकूलन की आवश्यकता।
👍