तर्क

भाषा मॉडल का उपयोग करके अनुमान कार्य वर्तमान में आर्टिफिशियल इंटेलिजेंस क्षेत्र का एक महत्वपूर्ण और चुनौतीपूर्ण हिस्सा है। अनुमान कार्य में जानकारी का विश्लेषण और उससे तार्किक निष्कर्ष निकालना शामिल होता है। यह केवल जानकारी खोजने या टेक्स्ट जनरेट करने से कहीं ज्यादा जटिल काम है।

Prompt : 57*32의 답은 무엇입니까?

57 और 32 को गुणा करने पर 1824 आता है।

ऐसी आसान समस्याओं को अब मैं अच्छी तरह हल कर सकता हूँ। चलिए थोड़ी मुश्किल समस्या देख लेते हैं।

Prompt : 242,343,232,12,1,423,3,2,433,42,21,51,26중 홀수인 숫자들을 더해보시오.

दी गई संख्याओं में से विषम संख्याओं को जोड़कर देखते हैं:

विषम संख्याएँ: 343, 1, 423, 3, 433, 21, 51

जोड़ने पर: 343 + 1 + 423 + 3 + 433 + 21 + 51 = 1675

इसलिए, दी गई संख्याओं में से विषम संख्याओं को जोड़ने पर कुल 1675 होगा।

क्या यह सही है? नहीं, यह गलत है। "1275" सही उत्तर है। आखिरकार ऐसा क्यों होता है?

भाषा मॉडल, खासकर बड़े भाषा मॉडल (Large Language Model, LLM), तरह-तरह के डेटा को प्रोसेस करने और जटिल संदर्भ से अर्थ निकालने में सक्षम हैं। फिर भी, इन मॉडलों में अनुमान, यानी रीजनिंग, के मामले में अभी भी सीमाएँ मौजूद हैं।

•

पाठ्य-आधारित प्रशिक्षण: भाषा मॉडल मूल रूप से वाक्य, पैराग्राफ, और बातचीत जैसे पाठ्य डेटा से प्रशिक्षित किए जाते हैं। ये डेटा ज्यादातर भाषा का अर्थ, संदर्भ और वाक्य विन्यास दर्शाते हैं—इनकी प्राथमिकता संख्यात्मक गणना या शुद्ध रूप से गणितीय प्रक्रिया नहीं, बल्कि भाषाई अर्थ पर होती है।

•

सांख्यिकीय अनुमान: भाषा मॉडल आँकड़ों के आधार पर सबसे संभावित शब्द या वाक्य की भविष्यवाणी करते हैं। यह तरीका भाषा के पैटर्न को पहचानने और उसकी नकल करने में असरदार है, लेकिन जटिल गणितीय गणना या गहरी तर्क-शक्ति के लिए इसमें सीमाएँ हैं।

•

डेटा की विविधता और सीमाएँ: यदि आपके प्रशिक्षण डेटा में संख्या-सम्बन्धी गणना या गणितीय समस्या के उदाहरण पर्याप्त नहीं हैं, तो मॉडल को ऐसे सवालों को सुलझाने में परेशानी हो सकती है।

•

भाषा-केंद्रित डिजाइन: भाषा मॉडल मुख्य रूप से भाषा को समझने और उत्पन्न करने पर केंद्रित होते हैं—गणितीय कौशल इन मॉडलों का मूल उद्देश्य या मुख्य कार्य नहीं है।

ज़रूर, लेकिन इसे इस तरह छोड़ देना AI शोधकर्ताओं के लिए ठीक नहीं। GPT-4 जैसे मॉडल में तो, पैसिव अनुमान/गणना के लिए स्पेशल लाइब्रेरी वगैरह का इस्तेमाल होता है और कोडिंग के जरिए यह समस्या हल हो रही है। दरअसल GPT-4 पर इसे चलाने से मसला इस तरह सुलझता है—

# 정의된 숫자들의 리스트
numbers = [242, 343, 232, 12, 1, 423, 3, 2, 433, 42, 21, 51, 26]

# 홀수인 숫자들만 필터링
odd_numbers = [num for num in numbers if num % 2 != 0]

# 홀수인 숫자들의 합계 계산
sum_of_odd_numbers = sum(odd_numbers)
sum_of_odd_numbers
---
output: 1275

इन सीमाओं को पार करने के लिए और भी उन्नत प्रॉम्प्ट इंजीनियरिंग तकनीकों की जरूरत होती है। प्रॉम्प्ट इंजीनियरिंग का अर्थ है मॉडल को और अधिक स्पष्ट, सटीक निर्देश देना, ताकि आपको इच्छित जानकारी या उत्तर और ठीक प्रकार से मिले। उदाहरण के लिए, कोई जटिल समस्या सुलझाने या कोई फैसला लेने में ज़रूरी अलग-अलग वेरिएबल्स और कंडीशन्स को मॉडल के लिए स्पष्ट रूप से बताना जरूरी है। ऊपर दिए गए उदाहरण में इसका उपयोग ऐसे किया जा सकता है।

बदलाव से पहले

Prompt : 242,343,232,12,1,423,3,2,433,42,21,51,26중 홀수인 숫자들을 더해보시오.

बदलाव के बाद

Prompt : 242,343,232,12,1,423,3,2,433,42,21,51,26 를 홀수와 짝수로 구별한 다음
홀수 인 숫자를 모두 더하시오. 이를 순서대로 진행해 주세요.

दी गई संख्याओं को विषम और सम में अलग करके, क्रम से विषम संख्याओं को जोड़ेंगे:

विषम संख्याएँ: 343, 1, 423, 3, 433, 21, 51
विषम संख्याओं का जोड़: 343 + 1 + 423 + 3 + 433 + 21 + 51 = 1275

तो दी गई संख्याओं में से सारी विषम संख्याओं को जोड़ने पर कुल 1275 होता है।

सिर्फ संकेत (प्रॉम्प्ट) परिवर्तन करके भी, सही उत्तर प्राप्त होता है—यह देखा जा सकता है। किसी को कुछ सिखाते वक्त, अगर स्टेप-बाय-स्टेप और क्रम से कराया जाए, तो समझ जल्दी आती है और काम की गुणवत्ता भी बढ़ती है।

भाषा मॉडल के ज़रिए अनुमान (रीजनिंग) करना अभी तक विकसित होते क्षेत्र में है, और इसे असरदार तरीके से करने के लिए निर्देश देने की क्षमता ज़रूरी है। ये विधियाँ मॉडल की रीजनिंग क्षमताओं का पूरा इस्तेमाल करवाती हैं और जटिल समस्याओं को हल करने में मदद करती हैं।

कॉपीराइट धारक की अनुमति से इसका उपयोग वाणिज्यिक प्रयोजनों के लिए किया जा सकता है, बशर्ते स्रोत का उल्लेख किया जाए।

Made with Slashpage