Este artículo propone LightRetriever para abordar los problemas de eficiencia en la recuperación de texto basada en modelos de lenguaje a gran escala (LLM). La recuperación actual basada en LLM requiere un esfuerzo computacional significativo para la codificación de consultas, lo que genera ralentizaciones y consumo de recursos. LightRetriever utiliza los LLM a gran escala existentes para la codificación de documentos, pero mejora drásticamente la velocidad al optimizar el proceso de codificación de consultas al nivel de una búsqueda integrada. Los resultados experimentales con una GPU A800 demuestran que la velocidad de codificación de consultas es más de 1000 veces mayor, el rendimiento general de búsqueda es más de 10 veces mayor y el rendimiento de recuperación se mantiene en un promedio del 95 % en diversas tareas.