Este artículo propone el Ajuste Eficiente de Parámetros Más Rápido (FPET), un novedoso método que mejora la velocidad de inferencia y la eficiencia de entrenamiento del Ajuste Eficiente de Parámetros (PET). Los métodos PET existentes se ven afectados por la latencia de inferencia inherente a los modelos base a gran escala y la sobrecarga computacional asociada a módulos adicionales. FPET introduce un módulo plug-and-play de reducción de redundancia de tokens, diseñado específicamente para PET, que refina los tokens en la capa de autoatención y los elimina mediante una estrategia de fusión de tokens totalmente diferenciable. Esto logra una mayor velocidad de inferencia y una mayor eficiencia de memoria, manteniendo un rendimiento comparable al de los métodos PET existentes.