दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

क्राइसिससेंस-एलएलएम: आपदा सूचना विज्ञान में बहु-लेबल सोशल मीडिया पाठ वर्गीकरण के लिए अनुदेशात्मक परिष्कृत वृहद भाषा मॉडल

Created by
  • Haebom

लेखक

काई यिन, बो ली, चेंगकाई लियू, अली मुस्तफावी, ज़िया हू

रूपरेखा

यह शोधपत्र एक नवीन दृष्टिकोण प्रस्तुत करता है जो आपदा-संबंधी सोशल मीडिया डेटा की बहुमुखी और गतिशील प्रकृति पर विचार करके मौजूदा एकल-लेबल वर्गीकरण मॉडल की सीमाओं को पार करता है। हम एक निर्देशात्मक फ़ाइन-ट्यूनिंग तकनीक प्रस्तुत करते हैं जो आपदा-संबंधी ट्वीट्स का बहु-लेबल वर्गीकरण करने के लिए एक बड़े पैमाने पर भाषा मॉडल (LLM) का उपयोग करती है। हम आपदा-संबंधी ट्वीट्स से एक व्यापक निर्देशात्मक डेटासेट बनाते हैं और इसका उपयोग आपदा-विशिष्ट ज्ञान को शामिल करने के लिए एक ओपन-सोर्स LLM को फ़ाइन-ट्यून करने के लिए करते हैं। यह फ़ाइन-ट्यून्ड मॉडल आपदा के प्रकार, सूचनात्मक मूल्य और मानवीय हस्तक्षेप सहित कई आयामों में सूचनाओं को एक साथ वर्गीकृत करता है, जिससे आपदा स्थितिजन्य जागरूकता के लिए सोशल मीडिया डेटा की उपयोगिता में उल्लेखनीय वृद्धि होती है। प्रायोगिक परिणाम दर्शाते हैं कि यह दृष्टिकोण सोशल मीडिया पोस्ट में महत्वपूर्ण सूचनाओं के वर्गीकरण को बेहतर बनाता है, जिससे यह आपातकालीन स्थितियों में स्थितिजन्य जागरूकता के लिए अधिक प्रभावी हो जाता है। यह अधिक उन्नत, अनुकूली और मजबूत आपदा प्रबंधन उपकरणों के विकास में योगदान देता है जो वास्तविक समय की स्थितिजन्य जागरूकता और प्रतिक्रिया रणनीतियों को बेहतर बनाते हैं।

Takeaways, Limitations

Takeaways:
बहु-लेबल वर्गीकरण आपदा-संबंधी सोशल मीडिया डेटा के विभिन्न पहलुओं का व्यापक विश्लेषण करने में सक्षम बनाता है।
एलएलएम-आधारित निर्देशात्मक फाइन-ट्यूनिंग तकनीकों के माध्यम से आपदा-विशिष्ट ज्ञान को मॉडलों में प्रभावी ढंग से शामिल करना।
प्रभावी आपदा प्रबंधन उपकरण विकसित करने की संभावना प्रस्तुत करना जो आपदा स्थिति जागरूकता और प्रतिक्रिया रणनीतियों को बेहतर बनाने में योगदान दे।
वास्तविक समय स्थितिजन्य जागरूकता और त्वरित प्रतिक्रिया के लिए आवश्यक जानकारी का कुशल निष्कर्षण
Limitations:
उपयोग किये गये डेटासेट के आकार और गुणवत्ता के बारे में विशिष्ट विवरण का अभाव।
अन्य बहु-लेबल वर्गीकरण मॉडलों के साथ तुलनात्मक विश्लेषण का अभाव
वास्तविक आपदा स्थितियों में वास्तविक समय अनुप्रयोग और प्रदर्शन मूल्यांकन का अभाव
विशिष्ट भाषाओं या क्षेत्रों के प्रति पक्षपाती डेटासेट का उपयोग करने की संभावना, और इसके परिणामस्वरूप खराब सामान्यीकरण प्रदर्शन की संभावना।
👍