본 논문은 생산 환경에서 대규모 언어 모델(LLM)을 사용할 때 발생하는 보안 문제, 특히 탈옥(jailbreak) 및 프롬프트 주입(prompt injection) 공격으로 인한 위험성을 해결하기 위해, 도메인 특화 전문가 모델인 Archias를 제안합니다. Archias는 사용자 질의를 자동차 산업 관련 질의, 악의적인 질의, 가격 주입, 프롬프트 주입, 도메인 외부 질의 등 여러 범주로 분류하고, 그 결과를 LLM 프롬프트에 통합하여 LLM의 응답 생성에 활용합니다. 이를 통해 LLM의 사용자 의도 이해 능력과 적절한 응답 생성 능력을 향상시키고, 자동차 산업을 위한 벤치마크 데이터셋을 공개하여 연구 발전에 기여합니다. Archias는 소규모 모델이기 때문에 다양한 산업에 맞춰 쉽게 사용자 정의가 가능하다는 장점이 있습니다.