본 논문은 저자원 언어의 혐오 표현 조정에서 비원어 사용자 모더레이터의 어려움을 다룹니다. 문화적 맥락 이해 부족으로 인한 부적절한 조정의 위험성을 지적하며, 이를 해결하기 위해 LLM-C3MOD라는 인간-LLM 협업 파이프라인을 제시합니다. LLM-C3MOD는 RAG 기반 문화적 맥락 주석, LLM 기반 초기 조정, 그리고 LLM 합의가 없는 경우를 위한 표적 인간 조정의 세 단계로 구성됩니다. 한국어 혐오 표현 데이터셋과 인도네시아어 및 독일어 사용자를 대상으로 평가한 결과, 78%의 정확도를 달성하여 GPT-4o의 71% 기준 성능을 능가하고, 인간의 작업량을 83.6% 감소시켰습니다. LLM이 어려워하는 미묘한 내용에서는 인간 모더레이터가 뛰어난 성능을 보였습니다.