Este artículo propone un modelo experto específico de dominio, Archias, para abordar las amenazas de seguridad (ataques de jailbreak e inyección de prompts) que surgen al utilizar modelos de lenguaje a gran escala (LLM) en entornos de producción. Archias clasifica las consultas de los usuarios en varias categorías, como preguntas dentro del dominio, preguntas maliciosas, inserción de precios, inserción de prompts y preguntas fuera del dominio, e integra los resultados en los prompts del LLM para generar respuestas. Los experimentos se realizaron principalmente en la industria automotriz, y Archias se puede personalizar y ajustar para diversos sectores gracias a su pequeño tamaño. Además, se publica un conjunto de datos de referencia.