Bài báo này đề xuất LightRetriever để giải quyết các vấn đề về hiệu quả trong việc truy xuất văn bản dựa trên mô hình ngôn ngữ quy mô lớn (LLM). Việc truy xuất dựa trên LLM hiện tại đòi hỏi khối lượng tính toán đáng kể cho việc mã hóa truy vấn, dẫn đến chậm và tiêu tốn tài nguyên. LightRetriever sử dụng các LLM quy mô lớn hiện có để mã hóa tài liệu, nhưng cải thiện đáng kể tốc độ bằng cách tinh giản quy trình mã hóa truy vấn xuống mức tra cứu nhúng. Kết quả thử nghiệm sử dụng GPU A800 cho thấy tốc độ mã hóa truy vấn nhanh hơn hơn 1.000 lần, thông lượng tìm kiếm tổng thể nhanh hơn hơn 10 lần và hiệu suất truy xuất được duy trì ở mức trung bình 95% trên nhiều tác vụ khác nhau.