[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

डीइन्फोरेग: बेहतर प्रशिक्षण प्रवाह के लिए एक पृथक शिक्षण ढांचा

Created by
  • Haebom

लेखक

ज़िह-हाओ हुआंग, यू-टेंग लिन, हंग-ह्सुआन चेन

रूपरेखा

इस पत्र में, हम एक नवीन दृष्टिकोण, सूचना नियमन के साथ वियुग्मित पर्यवेक्षित अधिगम (DeInfoReg) का प्रस्ताव करते हैं, जो लुप्त ग्रेडिएंट समस्या को कम करने के लिए लंबी ग्रेडिएंट धाराओं को कई छोटी धाराओं में परिवर्तित करता है। एक पाइपलाइनिंग रणनीति को शामिल करके, DeInfoReg कई GPU में मॉडल समानांतरीकरण को सक्षम बनाता है, जिससे प्रशिक्षण थ्रूपुट में उल्लेखनीय सुधार होता है। इस पत्र में, हम प्रस्तावित विधि की तुलना मानक बैकप्रोपेगेशन और अन्य ग्रेडिएंट स्ट्रीम अपघटन तकनीकों से करते हैं। विभिन्न कार्यों और डेटासेट पर व्यापक प्रयोगों के माध्यम से, हम प्रदर्शित करते हैं कि DeInfoReg पारंपरिक BP मॉडलों की तुलना में बेहतर प्रदर्शन और बेहतर शोर प्रतिरोध प्राप्त करता है, जबकि समानांतर कंप्यूटिंग संसाधनों का कुशलतापूर्वक उपयोग करता है। पुनरुत्पादन क्षमता के लिए कोड https://github.com/ianzih/Decoupled-Supervised-Learning-for-Information-Regularization/ पर उपलब्ध है ।

Takeaways, Limitations

Takeaways:
लुप्त ग्रेडिएंट समस्या को प्रभावी ढंग से कम करने के लिए एक नवीन विधि प्रस्तुत की गई है।
GPU समानांतर प्रसंस्करण के साथ प्रशिक्षण गति में सुधार करें।
यह मौजूदा तरीकों की तुलना में बेहतर प्रदर्शन और शोर प्रतिरोध दर्शाता है।
पुनरुत्पादन के लिए कोड प्रकटीकरण.
Limitations:
प्रस्तुत विधि की सामान्य प्रयोज्यता निर्धारित करने के लिए आगे के अध्ययन की आवश्यकता है।
विभिन्न आर्किटेक्चर और डेटासेट पर आगे और प्रयोग करने की आवश्यकता है।
पाइपलाइन रणनीति को लागू करने की जटिलता.
👍