दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

CTourLLM: चीनी पर्यटन ज्ञान के साथ LLM को बढ़ाना

Created by
  • Haebom

लेखक

क़िकाई वेई, मिंगज़ी यांग, जिंकियांग वांग, वेनवेई माओ, जिआबो जू, हुआनशेंग निंग

रूपरेखा

यह शोधपत्र CTourLLM का प्रस्ताव करता है, जो चीनी सांस्कृतिक पर्यटन में विशेषज्ञता वाला एक बड़े पैमाने का भाषा मॉडल (LLM) है। मौजूदा LLM में पर्यटन ज्ञान की कमी को दूर करने के लिए, हमने Cultour नामक एक नया डेटासेट बनाया है, जिसमें एक पर्यटन ज्ञान डेटाबेस, यात्रा वृत्तांत डेटा और पर्यटन QA डेटा शामिल हैं। इस डेटासेट का उपयोग करते हुए, हम पर्यवेक्षित शिक्षण का उपयोग करके Qwen-आधारित मॉडल को परिष्कृत करते हैं। CTourLLM के प्रदर्शन का मूल्यांकन करने के लिए, हम प्रासंगिकता, पठनीयता और उपलब्धता (RRA) नामक एक नए मूल्यांकन मीट्रिक का प्रस्ताव करते हैं, और स्वचालित और मानवीय दोनों मूल्यांकन करते हैं। प्रायोगिक परिणाम बताते हैं कि CTourLLM, BLEU-1 पैमाने पर ChatGPT से 1.21 और Rouge-L पैमाने पर 1.54 बेहतर प्रदर्शन करता है। Cultour डेटासेट सार्वजनिक रूप से उपलब्ध है।

Takeaways, Limitations

Takeaways:
चीनी सांस्कृतिक पर्यटन में विशेषज्ञता वाले उच्च गुणवत्ता वाले एलएलएम के विकास और प्रकाशन के माध्यम से पर्यटन संबंधी सेवाओं को बेहतर बनाने में योगदान देना।
भविष्य के अनुसंधान के लिए संसाधन उपलब्ध कराने हेतु एक नया डेटासेट, कल्चर, तैयार किया जा रहा है।
आरआरए मूल्यांकन मानदंडों के माध्यम से एलएलएम प्रदर्शन मूल्यांकन के लिए नए संकेतक प्रस्तुत करना।
चैटजीपीटी की तुलना में बेहतर प्रदर्शन के माध्यम से प्रस्तावित मॉडल की प्रभावशीलता का सत्यापन।
Limitations:
वर्तमान में केवल चीनी सांस्कृतिक पर्यटन पर ध्यान केंद्रित किया जा रहा है, अन्य क्षेत्रों में विस्तार की समीक्षा करना आवश्यक है।
आरआरए मूल्यांकन मानदंडों की निष्पक्षता और सामान्यीकरण को निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
मूल्यांकन के लिए उपयोग किए गए डेटासेट के आकार और विविधता की आगे समीक्षा की आवश्यकता है।
मूल्यांकन विधियों की सीमाएं जो केवल BLEU और ROUGE स्कोर को सुधारने पर ध्यान केंद्रित करती हैं।
👍