दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ग्रेडेड न्यूरल नेटवर्क

Created by
  • Haebom

लेखक

टोनी शस्का

रूपरेखा

इस शोधपत्र में, हम ग्रेड वेक्टर स्पेस $\V_\w^n$ पर निर्मित ग्रेडेड न्यूरल नेटवर्क (GNN) का एक नया ढांचा प्रस्तुत करते हैं, जो बीजगणितीय ग्रेडिंग को शामिल करके पारंपरिक न्यूरल नेटवर्क आर्किटेक्चर का विस्तार करता है। हम ग्रेड न्यूरॉन्स, लेयर्स, एक्टिवेशन फंक्शन और लॉस फंक्शन पेश करते हैं जो स्केलर क्रियाओं $\lambda \star \x = (\lambda^{q_i} x_i)$ के साथ निर्देशांक-वार ग्रेड संरचना का दोहन करके फीचर महत्व के अनुकूल होते हैं, जिसे ट्यूपल्स $\w = (q_0, \ldots, q_{n-1})$ द्वारा परिभाषित किया जाता है। ग्रेड स्पेस के सैद्धांतिक गुणों को स्थापित करने के बाद, हम एक व्यापक GNN डिज़ाइन प्रस्तुत करते हैं जो संख्यात्मक स्थिरता और ग्रेडिएंट स्केलिंग जैसी कम्प्यूटेशनल चुनौतियों को संबोधित करता है। संभावित अनुप्रयोग मशीन लर्निंग और फोटोनिक सिस्टम तक फैले हुए हैं, जिसका उदाहरण हाई-स्पीड लेजर-आधारित कार्यान्वयन है। यह कार्य ग्रेड कम्प्यूटेशन की दिशा में एक आधारभूत कदम प्रदान करता है जो गणितीय कठोरता को व्यावहारिक क्षमता के साथ जोड़ता है, और भविष्य के अनुभवजन्य और हार्डवेयर अन्वेषणों का मार्ग प्रशस्त करता है।

Takeaways, Limitations

Takeaways:
हम एक नवीन रैंक न्यूरल नेटवर्क (GNNs) ढांचा प्रस्तुत करते हैं जो मौजूदा न्यूरल नेटवर्क आर्किटेक्चर का विस्तार करता है।
रैंक न्यूरॉन्स, परतें, सक्रियण फ़ंक्शन और हानि फ़ंक्शन पेश करना जो विशेषता महत्व के अनुकूल होते हैं
संख्यात्मक स्थिरता और ग्रेडिएंट स्केलिंग समस्याओं का समाधान
मशीन लर्निंग और फोटोनिक प्रणालियों सहित विभिन्न क्षेत्रों में संभावित अनुप्रयोगों का सुझाव देता है
ग्रेड गणना के क्षेत्र के लिए एक बुनियादी सैद्धांतिक आधार प्रदान करता है
Limitations:
प्रस्तावित ढांचे के वास्तविक प्रदर्शन और दक्षता के प्रायोगिक सत्यापन का अभाव।
उच्च गति वाले लेजर-आधारित कार्यान्वयन सहित हार्डवेयर कार्यान्वयन पर विशिष्ट विवरण का अभाव।
रैंक वेक्टर स्पेस के चयन और रैंक पैरामीटर्स (Q_i) के निर्धारण पर स्पष्ट मार्गदर्शन का अभाव।
विविध डेटासेट और समस्याओं में सामान्यीकरण प्रदर्शन मूल्यांकन का अभाव
👍