본 논문은 문화적 맥락을 고려한 대화 이해를 위한 새로운 접근법을 제시합니다. 서구 문화와 아시아 문화 간의 대화 규범 차이를 예시로 들며, 문화적 맥락을 인식하는 능력이 NLP 모델에게 어려운 과제임을 강조합니다. 이를 해결하기 위해, 대화 정보와 문화적 정보 (사회적 규범, 위반 등)를 포함하는 "문화적 맥락 스키마"를 제안합니다. 중국 문화를 기반으로 약 23,000개의 대화에 대한 11만 개의 사회적 규범 및 위반 설명을 LLM을 이용하여 생성하고, 자동 검증 전략과 인간의 판단을 통해 개선합니다. 이러한 설명들을 의미 있는 구조인 "규범 개념"으로 구성하고, 대화에 대한 기호적 주석을 통해 연결합니다. 최종적으로 생성된 데이터셋을 감정, 감성, 발화 행위 탐지 등의 하류 작업에 활용하여 성능 향상을 보입니다.