[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

मतिभ्रम स्टेशन: ट्रांसफॉर्मर-आधारित भाषा मॉडल की कुछ बुनियादी सीमाओं पर

Created by
  • Haebom

लेखक

वरिन सिक्का, विशाल सिक्का

रूपरेखा

यह शोधपत्र कम्प्यूटेशनल जटिलता के दृष्टिकोण से बड़े पैमाने के भाषा मॉडल (एलएलएम) और एलएलएम-आधारित एजेंटों में उत्पन्न होने वाली भ्रांतियों और संबंधित प्रदर्शन सीमाओं का अन्वेषण करता है। हम दर्शाते हैं कि एक निश्चित जटिलता के बाद, एलएलएम कम्प्यूटेशनल और एजेंट कार्य नहीं कर सकते या उनकी शुद्धता की पुष्टि नहीं कर सकते।

Takeaways, Limitations

Takeaways: यह सुझाव देता है कि LLM की गणना क्षमता सीमित है और जटिल कार्यों को करने और सटीकता की पुष्टि करने में कठिनाई हो सकती है। यह जटिलता को ध्यान में रखते हुए LLM डिज़ाइन और उपयोग की आवश्यकता पर ज़ोर देता है।
Limitations: विशिष्ट जटिलता के मानदंड स्पष्ट रूप से प्रस्तुत नहीं किए गए हैं। विभिन्न प्रकार के कार्यों और कारकों के लिए सामान्यीकरण पर और अधिक शोध की आवश्यकता है। एलएलएम में मतिभ्रम की घटना का अधिक विस्तृत विश्लेषण आवश्यक है।
👍