[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

रेडी ज्यूरिस्ट वन: गतिशील वातावरण में कानूनी खुफिया जानकारी के लिए भाषा एजेंटों की बेंचमार्किंग

Created by
  • Haebom

लेखक

झेंग जिया, शेंगबिन यू, वेई चेन, सियुआन वांग, यिडोंग लियू, यूं सोंग, झोंगयु वेई

रूपरेखा

वास्तविक-विश्व विधिक अभ्यास की गतिशील प्रकृति और स्थिर मानदंडों के बीच की खाई को पाटने के लिए, यह शोधपत्र J1-ENVS प्रस्तुत करता है, जो LLM-आधारित एजेंटों के लिए पहला इंटरैक्टिव गतिशील विधिक वातावरण है। इसमें कानूनी विशेषज्ञों द्वारा निर्देशित, पर्यावरणीय जटिलता के तीन स्तरों पर चीनी विधिक अभ्यास के छह प्रतिनिधि परिदृश्य शामिल हैं। हम J1-EVAL भी प्रस्तुत करते हैं, जो एक सुक्ष्म मूल्यांकन ढाँचा है जिसे विधिक दक्षता के विभिन्न स्तरों पर कार्य निष्पादन और प्रक्रियात्मक अनुपालन का आकलन करने के लिए डिज़ाइन किया गया है। 17 LLM एजेंटों पर किए गए व्यापक प्रयोगों से पता चलता है कि कई मॉडल मज़बूत विधिक ज्ञान प्रदर्शित करते हैं, लेकिन गतिशील वातावरण में प्रक्रियात्मक निष्पादन में कठिनाई का अनुभव करते हैं। यहाँ तक कि अत्याधुनिक मॉडल, GPT-4o, भी समग्र प्रदर्शन में 60% से कम है। ये परिणाम गतिशील विधिक बुद्धिमत्ता प्राप्त करने में आने वाली चुनौतियों को उजागर करते हैं और भविष्य के शोध के लिए मूल्यवान अंतर्दृष्टि प्रदान करते हैं।

Takeaways, Limitations

Takeaways:
एक नए मूल्यांकन वातावरण J1-ENVS और मूल्यांकन ढांचे J1-EVAL की प्रस्तुति जो वास्तविक कानूनी अभ्यास की गतिशीलता को प्रतिबिंबित करती है।
एलएलएम-आधारित एजेंटों के कानूनी ज्ञान और प्रक्रियात्मक निष्पादन क्षमताओं का अनुभवजन्य विश्लेषण प्रदान करता है।
गतिशील कानूनी बुद्धिमत्ता और भविष्य की अनुसंधान दिशाओं को प्राप्त करने में चुनौतियाँ।
Limitations:
मूल्यांकन परिवेश J1-ENVS को चीनी कानूनी अभ्यास के आधार पर संरचित किया गया है, जो अन्य कानूनी प्रणालियों तक सामान्यीकरण को सीमित करता है।
मूल्यांकन किये गये मॉडलों की संख्या 17 तक सीमित है, तथा अधिक विविध मॉडलों पर आगे अनुसंधान की आवश्यकता है।
जीपीटी-4o सहित अत्याधुनिक मॉडलों का प्रदर्शन अभी भी 60% से नीचे है, जो यह दर्शाता है कि गतिशील कानूनी खुफिया जानकारी में सुधार के लिए और अधिक अनुसंधान और विकास की आवश्यकता है।
👍