यह शोधपत्र डेटा विश्लेषण को बेहतर बनाने के लिए SQL क्वेरीज़ में बड़े पैमाने के भाषा मॉडल (LLM) को एकीकृत करने के हालिया रुझानों का अन्वेषण करता है। Amazon, Databricks, Google और Snowflake जैसी कंपनियों द्वारा प्रस्तुत LLM-आधारित SQL क्वेरीज़ के लाभों के बावजूद, ओपन-सोर्स समाधानों में अक्सर कार्यक्षमता और प्रदर्शन की कमी होती है। यह अध्ययन पाँच प्रतिनिधि क्वेरीज़ का विश्लेषण करने के लिए दो ओपन-सोर्स सिस्टम और एक एंटरप्राइज़ प्लेटफ़ॉर्म का उपयोग करता है और वर्तमान SQL-आधारित LLM एकीकरणों की कार्यात्मक, प्रदर्शन और मापनीयता संबंधी सीमाओं को उजागर करता है। हम तीन प्रमुख चुनौतियों की पहचान करते हैं—संरचित आउटपुट लागू करना, संसाधन उपयोग का अनुकूलन करना और क्वेरी योजनाओं में सुधार करना—और उनके समाधान के लिए प्रारंभिक समाधान प्रस्तावित करते हैं, जो प्रदर्शन में सुधार प्रदर्शित करते हैं। हमारा सुझाव है कि LLM और DBMS के बीच सुदृढ़ एकीकरण LLM-आधारित SQL क्वेरीज़ की मापनीयता और दक्षता में सुधार के लिए महत्वपूर्ण है।