यह शोधपत्र बड़े पैमाने पर भाषा मॉडल (एलएलएम)-आधारित पाठ पुनर्प्राप्ति में दक्षता संबंधी समस्याओं के समाधान हेतु लाइटरिट्रीवर का प्रस्ताव करता है। मौजूदा एलएलएम-आधारित पुनर्प्राप्ति में क्वेरी एन्कोडिंग के लिए महत्वपूर्ण कम्प्यूटेशनल प्रयास की आवश्यकता होती है, जिसके परिणामस्वरूप प्रक्रिया धीमी हो जाती है और संसाधनों की खपत होती है। लाइटरिट्रीवर दस्तावेज़ एन्कोडिंग के लिए मौजूदा बड़े पैमाने पर एलएलएम का उपयोग करता है, लेकिन क्वेरी एन्कोडिंग प्रक्रिया को एम्बेडिंग लुकअप के स्तर तक सुव्यवस्थित करके गति में नाटकीय रूप से सुधार करता है। A800 GPU का उपयोग करके किए गए प्रायोगिक परिणाम दर्शाते हैं कि क्वेरी एन्कोडिंग गति 1,000 गुना से भी अधिक तेज़ है, समग्र खोज थ्रूपुट 10 गुना से भी अधिक तेज़ है, और विभिन्न कार्यों में पुनर्प्राप्ति प्रदर्शन औसतन 95% पर बना रहता है।