चेन-ऑफ-थॉट नामक एक तकनीक की घोषणा 2022 में जेसन वेई द्वारा की गई थी, जिन्होंने पहले जीरो-शॉट को परिभाषित किया था। जैसा कि नाम से पता चलता है, यह चेन प्रॉम्प्टिंग से संबंधित है। मामूली अंतर यह है कि बेहतर परिणाम प्राप्त करने के लिए मध्यवर्ती अनुमान चरण जानबूझकर जोड़े जाते हैं। यह उन जटिल कार्यों के लिए विशेष रूप से प्रभावी है जिनके लिए विस्तृत विचार प्रक्रियाओं की आवश्यकता होती है।
ChainofThought Prompting Elicits Reasoning in Large Language Models.pdf870.87KB
सीओटी प्रॉम्प्टिंग के लाभ
•
बहु-चरणीय समस्या अपघटन: सीओटी मॉडलों को बहु-चरणीय समस्याओं को मध्यवर्ती चरणों में विघटित करने की अनुमति देता है, जिसका अर्थ है कि अतिरिक्त गणना उन समस्याओं को सौंपी जा सकती है जिनके लिए अधिक अनुमान चरणों की आवश्यकता होती है।
•
मॉडल व्यवहार की व्याख्या: सीओटी एक व्याख्या योग्य विंडो प्रदान करता है कि मॉडल एक विशिष्ट उत्तर पर कैसे पहुंचता है और जहां अनुमान पथ गलत हो गया था वहां डीबग करने का अवसर प्रदान करता है।
•
विभिन्न प्रकार के कार्यों के लिए प्रयोज्यता: सीओटी तर्क का उपयोग गणितीय समस्याओं, सामान्य ज्ञान तर्क, प्रतीकात्मक हेरफेर और सिद्धांत रूप में किसी भी कार्य के लिए किया जा सकता है जिसे मनुष्य भाषा के माध्यम से हल कर सकते हैं।
•
बड़े पैमाने के भाषा मॉडल में आसान प्रेरण: सीओटी अनुक्रमों के उदाहरणों को शामिल करके पर्याप्त रूप से बड़े मौजूदा भाषा मॉडल में सीओटी अनुमान आसानी से प्राप्त किया जा सकता है।
क्या हम एक उदाहरण देंगे? यह उदाहरण पहले तर्क भाग में दिखाया गया है।
Prompt : 242,343,232,12,1,423,3,2,433,42,21,51,26 를 홀수와 짝수로 구별한 다음
홀수 인 숫자를 모두 더하시오. 이를 순서대로 진행해 주세요.
आइए विषम और सम संख्याओं के बीच अंतर करें और विषम संख्याओं को क्रम में जोड़ें:
इसलिए, यदि आप दी गई संख्याओं में से सभी विषम संख्याओं को जोड़ते हैं, तो आपको 1275 मिलता है।
यहां, 'विषम और सम संख्याओं के बीच अंतर करें और फिर सभी विषम संख्याओं को जोड़ें। वह भाग जो कहता है, 'कृपया क्रम से आगे बढ़ें।' कार्यों को एक श्रृंखला में अलग करने का निर्देश है। जब इस पद्धति पर पहली बार ध्यान गया, तो इसे 'चरण दर चरण' किया गया। ऐसा कहा गया है कि चरण-दर-चरण 'क्रम में' पूछने से बेहतर परिणाम मिलते हैं।
बेशक, सीओटी पद्धति की भी स्पष्ट सीमाएँ हैं। सीधे शब्दों में कहें तो, यह केवल उन मॉडलों पर प्रभावी हो सकता है जिनके दिमाग में बहुत कुछ है। दूसरे शब्दों में, कम संख्या में पैरामीटर वाले मॉडल में, जिसे एसएलएम कहा जाता है, सीओटी बिल्कुल भी अच्छा प्रदर्शन नहीं करता है। इस मामले में, फ़्यू-शॉट या वन-शॉट विधि बेहतर परिणाम दिखाती है।
सीओटी की सीमाएं
•
मॉडल आकार पर निर्भर: सीओटी प्रॉम्प्टिंग मुख्य रूप से केवल बड़े पैमाने के मॉडल (लगभग 70 बी पैरामीटर) के लिए सकारात्मक प्रदर्शन लाभ दिखाता है। छोटे पैमाने के मॉडल के लिए, सीओटी अप्रभावी हो सकता है या मानक संकेतों से भी बदतर प्रदर्शन कर सकता है।
•
सीमाएँ: हालाँकि CoT एक मानव तर्ककर्ता की विचार प्रक्रिया की नकल करता है, फिर भी यह अभी भी अज्ञात है कि क्या यह वास्तव में एक तंत्रिका नेटवर्क 'तर्क' है। इसके अतिरिक्त, जबकि किसी उदाहरण को सीओटी तक मैन्युअल रूप से विस्तारित करने की लागत छोटी हो सकती है, फाइन-ट्यूनिंग के लिए एनोटेशन की लागत काफी बढ़ सकती है। सीओटी सही अनुमान पथ की गारंटी नहीं देता है, और यह भी ध्यान में रखा जाना चाहिए कि वास्तविक अनुप्रयोगों में बड़े मॉडल का उपयोग करने की लागत अधिक है।
बहरहाल, सीओटी प्रॉम्प्टिंग भाषा मॉडल का उपयोग करके विभिन्न कार्यों में तर्क क्षमता में सुधार करने का एक प्रभावी तरीका है। सबसे पहले, चूंकि हमारे उपयोगकर्ताओं को दिए गए मॉडल वर्तमान में 100बी के आसपास हैं, इसलिए यह विधि सार्थक नहीं है।
ⓒ 2023. हेबॉम, सभी अधिकार सुरक्षित।
कॉपीराइट धारक की अनुमति से इसका उपयोग वाणिज्यिक प्रयोजनों के लिए किया जा सकता है, बशर्ते स्रोत का उल्लेख किया जाए।