दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एक एम्बेडेड हार्डवेयर प्लेटफ़ॉर्म पर पर्यावरणीय ध्वनि वर्गीकरण

Created by
  • Haebom

लेखक

गेब्रियल बिब्बो, अर्शदीप सिंह, मार्क डी. प्लम्बली

रूपरेखा

यह पत्र रास्पबेरी पाई जैसे संसाधन-विवश उपकरणों पर एक पूर्व-प्रशिक्षित, बड़े पैमाने पर ऑडियो न्यूरल नेटवर्क को तैनात करते समय प्रदर्शन परिवर्तनों का विश्लेषण करता है। हम प्रयोगात्मक रूप से सीपीयू तापमान, माइक्रोफोन की गुणवत्ता और ऑडियो सिग्नल की मात्रा के प्रदर्शन पर प्रभाव का अध्ययन करते हैं, जिससे पता चलता है कि निरंतर सीपीयू उपयोग के कारण बढ़ता तापमान रास्पबेरी पाई के स्वचालित धीमा तंत्र को ट्रिगर करता है, जिससे अनुमान विलंबता प्रभावित होती है। इसके अलावा, हम प्रदर्शित करते हैं कि Google AIY वॉयस किट जैसे सस्ती उपकरणों पर माइक्रोफोन की गुणवत्ता और ऑडियो सिग्नल की मात्रा सिस्टम के प्रदर्शन को प्रभावित करती है। हम लाइब्रेरी संगतता और रास्पबेरी पाई की अनूठी प्रोसेसर आर्किटेक्चर आवश्यकताओं से संबंधित महत्वपूर्ण चुनौतियों का अनुभव करते हैं, जिससे यह प्रक्रिया एक मानक कंप्यूटर (पीसी) की तुलना में कम सरल हो जाती है।

____T52330_____, Limitations

Takeaways:
रास्पबेरी पाई जैसे एज डिवाइसों पर ऑडियो न्यूरल नेटवर्क की वास्तविक समय पर तैनाती में आने वाली चुनौतियों को स्पष्ट करता है (बढ़े हुए सीपीयू तापमान, माइक्रोफोन की गुणवत्ता और ऑडियो सिग्नल वॉल्यूम का प्रभाव)।
हम एज डिवाइस वातावरण में वास्तविक समय ऑडियो वर्गीकरण मॉडल विकसित करने और तैनात करने के लिए महत्वपूर्ण विचार (हार्डवेयर बाधाएं, पर्यावरणीय कारक) प्रस्तुत करते हैं।
अधिक कुशल और मजबूत एज डिवाइसों के लिए ऑडियो मॉडल विकसित करने और अनुकूलित करने के लिए भविष्य के अनुसंधान दिशाओं का सुझाव देना (कॉम्पैक्ट मॉडल का विकास, ताप अपव्यय हार्डवेयर का डिजाइन, और माइक्रोफोन चयन)।
Limitations:
प्रायोगिक परिणाम विशिष्ट हार्डवेयर (रास्पबेरी पाई) और माइक्रोफ़ोन (गूगल एआईवाई वॉइस किट) तक सीमित हैं। विभिन्न हार्डवेयर और वातावरणों में इसकी सामान्यता निर्धारित करने के लिए और अधिक शोध की आवश्यकता है।
वास्तविक परिनियोजन के दौरान आने वाली कठिनाइयों, जैसे लाइब्रेरी संगतता और प्रोसेसर आर्किटेक्चर संबंधी समस्याओं के लिए विशिष्ट समाधानों का अभाव।
प्रयोगों में प्रयुक्त ऑडियो न्यूरल नेटवर्क के प्रकार और आकार के बारे में विशिष्ट जानकारी का अभाव।
👍