본 연구는 19세기 라틴 아메리카 신문에서 대규모 언어 모델(LLMs)을 이용하여 데이터셋을 개선하고 반어법 감지를 향상시키는 방법을 탐구합니다. BERT와 GPT-4o 모델을 사용하여 다중 클래스 및 이진 분류 작업을 통해 반어의 미묘한 뉘앙스를 포착하는 효과를 평가하기 위해 두 가지 전략을 사용했습니다. 첫 번째 전략으로 감정적 및 문맥적 단서를 풍부하게 하는 데이터셋 개선에 중점을 두었지만, 이는 역사적 언어 분석에 제한적인 영향을 미쳤습니다. 두 번째 전략인 반자동 주석 프로세스는 클래스 불균형을 효과적으로 해결하고 고품질 주석으로 데이터셋을 확장했습니다. 반어의 복잡성으로 인한 어려움에도 불구하고, 본 연구는 감정 분석 발전에 두 가지 주요 기여를 합니다. 첫째, 감정 분석 및 반어 감지를 위해 태깅된 새로운 역사적 스페인어 데이터셋을 소개하고, 둘째, 역사적, 문화적 맥락을 핵심 특징으로 통합하여 LLMs 결과를 개선하는 데 인간 전문 지식이 중요한 반자동 주석 방법론을 제안합니다.