दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

बाइटजेन: बाइट स्पेस में ऑर्डरबुक इवेंट्स के लिए एक टोकनाइज़र-मुक्त जेनरेटिव मॉडल

Created by
  • Haebom

लेखक

यांग ली, ज़ी चेन

रूपरेखा

यह शोधपत्र उच्च-आवृत्ति ऑर्डर बुक (एलओबी) गतिकी के जनरेटिव मॉडलिंग की चुनौतीपूर्ण समस्या का समाधान करने के लिए एक नवीन जनरेटिव मॉडल, बाइटजेन, प्रस्तुत करता है। मौजूदा दृष्टिकोण सरलीकृत संभाव्य मान्यताओं पर निर्भरता के कारण सीमाओं से ग्रस्त हैं, या, ट्रांसफॉर्मर जैसे आधुनिक गहन शिक्षण मॉडलों के मामले में, टोकनीकरण तकनीकें जो डेटा के उच्च-परिशुद्धता संख्यात्मक गुणों को प्रभावित करती हैं। बाइटजेन एलओबी घटनाओं की कच्ची बाइट स्ट्रीम को सीधे संसाधित करके इन सीमाओं को पार करता है। सूचना हानि के बिना बाज़ार संदेशों का प्रतिनिधित्व करने के लिए, हम एक 32-बाइट संपीड़ित बाइनरी प्रारूप डिज़ाइन करते हैं और एक ऑटोरिग्रैसिव नेक्स्ट-बाइट भविष्यवाणी कार्य के साथ समस्या का समाधान करते हैं। फ़ीचर इंजीनियरिंग और टोकनीकरण को पूरी तरह से समाप्त करके, हम एक बुनियादी प्रतिनिधित्व से बाज़ार की गतिशीलता सीखते हैं। एच-नेट आर्किटेक्चर को लागू करके, हम पूर्वनिर्धारित नियमों के बिना बाज़ार संदेशों की अंतर्निहित संरचना की खोज के लिए एक गतिशील चंकिंग तंत्र का उपयोग करते हैं। सीएमई बिटकॉइन फ्यूचर्स से 34 मिलियन से अधिक घटनाओं पर प्रशिक्षण द्वारा, हम यथार्थवादी मूल्य वितरण, हेवी-टेल रिटर्न और बर्स्ट इवेंट टाइमिंग सहित वित्तीय बाजारों की प्रमुख विशेषताओं को सफलतापूर्वक पुन: प्रस्तुत करते हैं।

Takeaways, Limitations

Takeaways:
एलओबी मॉडलिंग के लिए पहला एंड-टू-एंड बाइट-स्तरीय फ्रेमवर्क प्रस्तुत किया गया।
एक कुशल संपीड़ित डेटा प्रतिनिधित्व विधि का प्रस्ताव।
टोकनाइजेशन पूर्वाग्रह के बिना मानक बाजार गुणवत्ता मेट्रिक्स पर प्रतिस्पर्धी प्रदर्शन प्राप्त करें।
हम यह प्रदर्शित करते हैं कि बाइट स्पेस में सीधे सीखना जटिल वित्तीय प्रणालियों के मॉडलिंग के लिए एक आशाजनक और लचीला प्रतिमान है।
Limitations:
वर्तमान में, केवल सीएमई बिटकॉइन वायदा डेटा के परिणाम प्रस्तुत किए गए हैं, और अन्य परिसंपत्तियों या बाजारों के लिए सामान्यीकरण निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
एच-नेट आर्किटेक्चर के गतिशील चंकिंग तंत्र के विस्तृत विवरण की कमी के कारण पुनरुत्पादनशीलता का सत्यापन आवश्यक हो जाता है।
मॉडल की मापनीयता और कम्प्यूटेशनल लागत के विश्लेषण का अभाव।
👍