Este artículo presenta un método novedoso, "MetaGen Blended RAG", para abordar los desafíos que enfrenta la Generación Aumentada por Recuperación (RAG) en conjuntos de datos de dominio específico: aislados tras cortafuegos y ricos en terminología compleja y especializada que no se encuentra durante el preentrenamiento LLM. Para abordar tres desafíos clave de las RAG existentes (variación semántica interdominio, el costo del ajuste fino y la falta de generalización, y la dificultad de lograr una precisión de cero disparos), proponemos un método para mejorar la recuperación semántica mediante un flujo de generación de metadatos y un índice de consulta híbrido que utiliza vectores densos y dispersos. Al aprovechar conceptos clave, temas y abreviaturas para generar un índice semántico rico en metadatos y una consulta híbrida mejorada, nuestro método logra un rendimiento robusto y escalable sin necesidad de ajustes finos. Supera los modelos de referencia de RAG de cero disparos existentes en los conjuntos de datos PubMedQA, SQuAD y NQ, e incluso compite con los modelos ajustados. Esto representa un enfoque novedoso para construir sistemas de recuperación semántica con generalización superior en todos los dominios.