본 논문은 생산 환경에서 대규모 언어 모델(LLM)을 사용할 때 발생하는 보안 위협(탈옥 및 프롬프트 삽입 공격)을 해결하기 위해, 도메인 특화된 전문가 모델 Archias를 제안한다. Archias는 사용자 질의를 도메인 내, 악의적인 질문, 가격 삽입, 프롬프트 삽입, 도메인 외 질문 등 여러 범주로 분류하고, 그 결과를 LLM 프롬프트에 통합하여 LLM의 응답 생성에 활용한다. 자동차 산업을 중심으로 실험을 진행하였으며, Archias는 작은 크기로 인해 다양한 산업에 맞춤형으로 조정 및 미세 조정이 가능하고, 벤치마크 데이터셋 또한 공개한다.