दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

फिनबर्ट2: बड़े भाषा मॉडल के वित्त-विशिष्ट परिनियोजन में अंतर को पाटने के लिए एक विशेष द्विदिशात्मक एनकोडर

Created by
  • Haebom

लेखक

ज़ुआन जू, फूफांग वेन, बेइलिन चू, झिबिंग फू, किनहोंग लिन, जियाकी लियू, बिन्जी फी, यू ली, लिन्ना झोउ, झोंगलियांग यांग

रूपरेखा

यह शोधपत्र वित्तीय क्षेत्र में बड़े पैमाने पर भाषा मॉडल (LLM) लागू करने की सीमाओं को इंगित करता है, और इस समस्या को हल करने के लिए एक चीनी वित्त-विशिष्ट BERT मॉडल, FinBERT2 का प्रस्ताव करता है। इसकी उच्च कम्प्यूटेशनल लागत के बावजूद, LLM वित्तीय भावना विश्लेषण जैसे विभेदक कार्यों में फाइन-ट्यून्ड BERT से कम प्रदर्शन करता है, जनरेटिव कार्यों में विशेष जानकारी प्रदान करने के लिए रिट्रीवल ऑगमेंटेड जेनरेशन (RAG) विधि पर बहुत अधिक निर्भर करता है, और विषय मॉडलिंग जैसे अन्य फीचर-आधारित परिदृश्यों में भी कमज़ोर है। FinBERT2 एक द्विदिश एनकोडर मॉडल है जो 32 बिलियन टोकन के उच्च-गुणवत्ता वाले वित्तीय-विशिष्ट कॉर्पस पर पहले से प्रशिक्षित है, और पाँच वित्तीय वर्गीकरण कार्यों में मौजूदा (Fin)BERT मॉडल और LLM से बेहतर प्रदर्शन करता है। इसके अलावा, FinBERT2 पर आधारित Fin-Retrievers वित्तीय पुनर्प्राप्ति कार्यों में मौजूदा एम्बेडिंग मॉडल से बेहतर प्रदर्शन करते हैं, और Fin-TopicModel वित्तीय शीर्षकों के लिए उत्कृष्ट क्लस्टरिंग और विषय प्रतिनिधित्व सक्षम करता है। निष्कर्ष में, फिनबर्ट2 एलएलएम युग में वित्त-विशिष्ट मॉडल का उपयोग करने का एक प्रभावी तरीका सुझाता है।

Takeaways, Limitations

Takeaways:
हम प्रदर्शित करते हैं कि FinBERT2, एक वित्त-विशिष्ट BERT मॉडल, LLM की सीमाओं पर काबू पाता है और वित्तीय क्षेत्र में बेहतर प्रदर्शन प्राप्त करता है।
फिनबर्ट2 वर्गीकरण, पुनर्प्राप्ति और विषय मॉडलिंग सहित विभिन्न वित्तीय-संबंधित कार्यों में मौजूदा मॉडलों की तुलना में बेहतर प्रदर्शन प्रदान करता है।
हम LLM युग में वित्तीय क्षेत्र में BERT मॉडल का प्रभावी ढंग से उपयोग करने की एक विधि प्रस्तुत करते हैं।
Limitations:
चूंकि फिनबर्ट2 चीनी वित्तीय डेटा के लिए विशिष्ट है, इसलिए अन्य भाषाओं या डोमेन के लिए इसकी सामान्यता सीमित हो सकती है।
चूंकि यह शोधपत्र एक निश्चित आकार के कॉर्पस और मॉडल के लिए परिणाम प्रस्तुत करता है, इसलिए डेटा या मॉडल के अन्य पैमानों पर सामान्यीकरण के लिए आगे के अध्ययन की आवश्यकता है।
RAG विधि के प्रदर्शन सुधार की चर्चा सीमित है। FinBERT2 को RAG के साथ संयोजित करने पर प्रदर्शन सुधार की जांच के लिए आगे अनुसंधान की आवश्यकता हो सकती है।
👍