Este documento propone dos enfoques novedosos para abordar el problema Limitations de la Generación Aumentada por Recuperación (RAG), que ha atraído la atención como un método para integrar información de vanguardia en modelos de lenguaje a gran escala (LLM) o construir modelos específicos del dominio. RAG utiliza múltiples modelos de incrustación, pero sus características heterogéneas conducen a discrepancias en los resultados del cálculo de similitud y la calidad de las respuestas LLM. Para abordar esto, proponemos RAG de Integración Mixta y RAG Confident. RAG de Integración Mixta integra los resultados de recuperación de múltiples modelos de incrustación, pero no mejora el rendimiento sobre RAG convencional. Por otro lado, RAG Confident genera respuestas varias veces utilizando múltiples modelos de incrustación y selecciona la respuesta con la mayor confianza. Este enfoque mejora el rendimiento en aproximadamente un 10% y un 5% sobre LLM y RAG convencionales, respectivamente. Los resultados consistentes en varios LLM y modelos de integración demuestran que Confident RAG es un enfoque plug-and-play eficiente aplicable a una amplia gama de campos.