दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

HAPI: मानव वरीयताओं से रोबोट के चेहरे के भाव सीखने का एक मॉडल

Created by
  • Haebom

लेखक

डोंगशेंग यांग, कियानयिंग लियू, वतरू सातो, ताकाशी मिनाटो, चाओरन लियू, शिन्या निशिदा

रूपरेखा

यह शोधपत्र रोबोट के चेहरे के भाव निर्माण की यथार्थवादिता और स्वाभाविकता को बेहतर बनाने के लिए एक नवीन शिक्षण-रैंकिंग रूपरेखा का प्रस्ताव करता है। मौजूदा मैनुअल समायोजन विधियों में अभिव्यक्ति की नाजुकता और यथार्थवाद के संदर्भ में सीमाएँ हैं, और इस अध्ययन का उद्देश्य मानव वरीयता डेटा का उपयोग करके इन सीमाओं को दूर करना है। विशेष रूप से, हम मानव वरीयता डेटा एकत्र करने के लिए जोड़ीदार तुलना एनोटेशन का उपयोग करते हैं, और चेहरे के भाव मूल्यांकन को बेहतर बनाने के लिए सियामी रैंकनेट पर आधारित HAPI (ह्यूमन अफेक्टिव पेयरवाइज इंप्रेशन) मॉडल विकसित करते हैं। बायेसियन ऑप्टिमाइज़ेशन और 35-DOF एंड्रॉइड प्लेटफ़ॉर्म पर एक ऑनलाइन चेहरे के भाव सर्वेक्षण का उपयोग करके प्रयोगात्मक परिणाम दिखाते हैं कि प्रस्तावित विधि मौजूदा विधियों की तुलना में क्रोध, खुशी और आश्चर्य के चेहरे के भावों को अधिक यथार्थवादी और सामाजिक रूप से संबंधित बनाती है। यह पुष्टि करता है कि प्रस्तावित रूपरेखा मानव वरीयता और मॉडल भविष्यवाणी के बीच की खाई को प्रभावी ढंग से पाटती है, और रोबोट के चेहरे के भाव निर्माण को मानवीय भावनात्मक प्रतिक्रियाओं से मेल खाती है।

Takeaways, Limitations

Takeaways:
रोबोट के चेहरे के भाव उत्पन्न करने का एक नया तरीका जो मानवीय प्राथमिकताओं को ध्यान में रखता है
सियामी रैंकनेट पर आधारित HAPI मॉडल का उपयोग करके चेहरे के भावों के मूल्यांकन की सटीकता में सुधार करना
35-DOF एंड्रॉइड प्लेटफॉर्म का उपयोग करके प्रयोगात्मक परिणाम, मौजूदा तरीकों की तुलना में यथार्थवादी और प्राकृतिक चेहरे की अभिव्यक्तियों का सफल निर्माण
मानवीय भावनात्मक प्रतिक्रियाओं और रोबोट चेहरे की अभिव्यक्ति निर्माण के बीच प्रभावी संबंध
Limitations:
वर्तमान में, केवल तीन भावनात्मक अभिव्यक्तियों, क्रोध, खुशी और आश्चर्य का परीक्षण किया गया है। अधिक विविध भावनात्मक अभिव्यक्तियों पर विस्तृत शोध की आवश्यकता है।
35-DOF एंड्रॉइड प्लेटफ़ॉर्म के लिए विशिष्ट परिणाम। अन्य रोबोट प्लेटफ़ॉर्म पर सामान्यीकरण की पुष्टि की जानी चाहिए।
लोगों की पसंद के डेटा एकत्र करने की लागत और समय की खपत को ध्यान में रखते हुए, अधिक कुशल डेटा संग्रह विधियों पर शोध की आवश्यकता है।
👍