[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

क्यूस्पार्क: विश्वसनीय क्यूस्किट कोड निर्माण की ओर

Created by
  • Haebom

लेखक

कियाना खीरी, आमना आमिर, एंड्री मिरांस्की, चेन डिंग

रूपरेखा

यह शोधपत्र क्वांटम परिपथों की त्रुटि सहनशीलता में सुधार हेतु सुदृढीकरण अधिगम (RL) तकनीकों का उपयोग करके बड़े पैमाने के भाषा मॉडल (LLM) के फ़ाइन-ट्यूनिंग का अध्ययन करता है। ग्रेनाइट-20B-कोड और स्टारकोडर जैसे मौजूदा LLM द्वारा अक्सर गलत Qiskit कोड उत्पन्न करने की समस्या का समाधान करने के लिए, हमने दो RL विधियों: ग्रुप रिलेटिव पॉलिसी ऑप्टिमाइज़ेशन (GRPO) और ऑड्स-रेशियो प्रेफरेंस ऑप्टिमाइज़ेशन (ORPO) का उपयोग करके एक समृद्ध रूप से एनोटेट किए गए सिंथेटिक डेटासेट पर 32B मॉडल को फ़ाइन-ट्यून किया है। Qiskit ह्यूमनएवल बेंचमार्क पर, ORPO ने 56.29% Pass@1 (ग्रेनाइट-8B-QK की तुलना में लगभग 10% सुधार) प्राप्त किया, जबकि GRPO ने 49% प्राप्त किया, जो सभी मौजूदा सामान्य-उद्देश्य बेसलाइन मॉडलों से बेहतर प्रदर्शन करता है। मूल ह्यूमनएवल में, उन्होंने क्रमशः 65.90% और 63.00% अंक प्राप्त किए। जीआरपीओ बुनियादी कार्यों में मजबूत है, जबकि ओआरपीओ मध्यवर्ती कार्यों में मजबूत है, लेकिन यह उन्नत कार्यों को हल करने में विफल रहता है, जो एआई-आधारित क्वांटम प्रोग्रामिंग की क्षमता और सीमाओं दोनों को प्रदर्शित करता है।

Takeaways, Limitations

Takeaways:
हम प्रदर्शित करते हैं कि आरएल तकनीकों का उपयोग एलएलएम के क्वांटम प्रोग्रामिंग प्रदर्शन को बेहतर बनाने के लिए किया जा सकता है।
दोनों आरएल विधियां, जीआरपीओ और ओआरपीओ, मौजूदा सामान्य प्रयोजन बेसलाइन मॉडलों की तुलना में प्रदर्शन में सुधार प्राप्त करती हैं।
विभिन्न कठिनाई स्तरों के कार्यों के प्रदर्शन विश्लेषण के माध्यम से एआई-आधारित क्वांटम प्रोग्रामिंग की वर्तमान स्थिति और भविष्य की दिशा प्रस्तुत करना।
Limitations:
कठिन क्वांटम प्रोग्रामिंग समस्याओं को हल करने में अभी भी कठिनाई हो रही है।
चूंकि इसे सिंथेटिक डेटासेट का उपयोग करके प्रशिक्षित किया गया था, इसलिए वास्तविक क्वांटम प्रोग्रामिंग वातावरण में इसके प्रदर्शन के लिए आगे सत्यापन की आवश्यकता है।
दोनों आर.एल. विधियां विशिष्ट प्रकार के कार्यों में अपनी ताकत दिखाती हैं, तथा सभी प्रकार के कार्यों के लिए सामान्यीकरण प्रदर्शन में सुधार की आवश्यकता है।
👍