दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

मानव-स्तरीय निर्देशों से मानव-वस्तु अंतःक्रिया

Created by
  • Haebom

लेखक

जेन वू, जियामन ली, पेई जू, सी. करेन लियू

रूपरेखा

यह शोधपत्र बुद्धिमान एजेंटों के लिए एक ऐसी प्रणाली का प्रस्ताव करता है जो मानव-स्तरीय निर्देशों का पालन करते हुए नियमित कार्यों को करने के लिए अपने परिवेश के साथ स्वायत्त रूप से अंतःक्रिया करते हैं। इस प्रणाली को मानव-स्तरीय निर्देशों की सटीक व्याख्या करने के लिए दुनिया की मूलभूत समझ के साथ-साथ व्युत्पन्न क्रियाओं को निष्पादित करने के लिए सटीक निम्न-स्तरीय गति और अंतःक्रिया कौशल की आवश्यकता होती है। हम पहली पूर्ण प्रणाली प्रस्तुत करते हैं जो प्रासंगिक परिवेशों में वस्तु हेरफेर के लिए भौतिक रूप से प्रशंसनीय, दीर्घकालिक मानव-वस्तु अंतःक्रियाओं का संश्लेषण करती है। एक बड़े पैमाने के भाषा मॉडल (LLM) का लाभ उठाते हुए, हम इनपुट निर्देशों की व्याख्या विस्तृत निष्पादन योजनाओं में करते हैं। पिछले कार्यों के विपरीत, हम उंगली-वस्तु अंतःक्रियाएँ उत्पन्न करते हैं जो पूरे शरीर की गतिविधियों के साथ सहजता से समन्वयित होती हैं। इसके अलावा, हम एक ऐसी नीति का प्रशिक्षण देते हैं जो गतियों की भौतिक प्रशंसनीयता सुनिश्चित करने के लिए सुदृढीकरण अधिगम (RL) का उपयोग करके भौतिकी सिमुलेशन से उत्पन्न गतियों को ट्रैक करती है। प्रायोगिक परिणाम जटिल परिवेशों में विविध वस्तुओं के साथ यथार्थवादी अंतःक्रियाओं के संश्लेषण में प्रणाली की प्रभावशीलता को प्रदर्शित करते हैं, और व्यावहारिक अनुप्रयोगों के लिए इसकी क्षमता को उजागर करते हैं।

Takeaways, Limitations

Takeaways:
हम पहली पूर्ण प्रणाली का प्रस्ताव करते हैं जो मानव-स्तरीय निर्देशों को समझती है और भौतिक रूप से संभव दीर्घकालिक मानव-वस्तु अंतःक्रियाओं को संश्लेषित करती है।
उंगली-वस्तु की अंतःक्रियाओं और पूर्ण-शरीर की गतिविधियों के सहज समन्वय के माध्यम से यथार्थवादी अंतःक्रियाएं बनाएं।
नीति प्रशिक्षण जो सुदृढीकरण सीखने के माध्यम से भौतिक वैधता सुनिश्चित करता है।
विभिन्न वस्तुओं और जटिल वातावरणों के साथ प्रयोगों के माध्यम से व्यावहारिक प्रयोज्यता का प्रदर्शन करना।
Limitations:
वर्तमान प्रणाली की वास्तविक दुनिया में प्रयोज्यता की सीमाएं स्पष्ट रूप से नहीं बताई गई हैं।
विभिन्न कार्यों के लिए प्रणाली की बहुमुखी प्रतिभा और प्रयोज्यता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
एलएलएम में व्याख्या संबंधी त्रुटियों या भौतिकी सिमुलेशन की सीमाओं के कारण त्रुटियों की संभावना है।
👍