Este artículo se centra en la detección de señas, una tarea que identifica y localiza señas individuales en vídeos continuos de lengua de señas. Esta detección desempeña un papel crucial para abordar la grave escasez de datos en la traducción de lengua de señas y para escalar los esfuerzos de anotación de conjuntos de datos. Para abordar las limitaciones de los enfoques existentes, que incluyen la flexibilidad léxica limitada y la ambigüedad inherente de los flujos continuos de señas, presentamos un novedoso marco de trabajo sin entrenamiento que integra un modelo lingüístico a gran escala (LLM). Este marco extrae características espaciotemporales y manuales y las relaciona con un amplio diccionario de lengua de señas mediante distorsión temporal dinámica (DTW) y similitud de coseno. Proporciona una excelente flexibilidad léxica sin necesidad de reentrenar el modelo y utiliza el LLM para realizar la desambiguación de glosas sensible al contexto mediante la búsqueda de haces. Los resultados experimentales en conjuntos de datos de lengua de señas sintéticos y del mundo real demuestran una precisión y una fluidez oracional superiores en comparación con los métodos existentes.