Este artículo presenta un estudio para mejorar la eficiencia de la Bondad de Pronunciación (GOP), una métrica de medición de la calidad de la pronunciación utilizada en sistemas de entrenamiento de pronunciación asistido por computadora (CAPT). Los GOP existentes se basan en la alineación forzada, que es vulnerable a errores de etiquetado y segmentación debido a variaciones acústicas. Se han propuesto métodos sin alineación, pero son computacionalmente costosos y presentan problemas de degradación del rendimiento con la longitud de las secuencias de fonemas y el tamaño de las listas de fonemas. Por lo tanto, en este artículo, proponemos un GOP sin alineación con capacidad de sustitución que restringe las sustituciones de fonemas en función de los grupos de fonemas y los errores comunes del aprendiz. Evaluamos el método propuesto utilizando dos conjuntos de datos de habla en inglés L2 (My Pronunciation Coach (MPC) y SpeechOcean762) y demostramos que supera a los métodos existentes.