Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Historical Ink: Exploring Large Language Models for Irony Detection in 19th-Century Spanish

Created by
  • Haebom

저자

Kevin Cohen, Laura Manrique-Gomez, Ruben Manrique

개요

본 연구는 19세기 라틴 아메리카 신문에서 대규모 언어 모델(LLMs)을 이용하여 데이터셋을 개선하고 반어법 감지를 향상시키는 방법을 탐구합니다. BERT와 GPT-4o 모델을 사용하여 다중 클래스 및 이진 분류 작업을 통해 반어의 미묘한 뉘앙스를 포착하는 효과를 평가하기 위해 두 가지 전략을 사용했습니다. 첫 번째 전략으로 감정적 및 문맥적 단서를 풍부하게 하는 데이터셋 개선에 중점을 두었지만, 이는 역사적 언어 분석에 제한적인 영향을 미쳤습니다. 두 번째 전략인 반자동 주석 프로세스는 클래스 불균형을 효과적으로 해결하고 고품질 주석으로 데이터셋을 확장했습니다. 반어의 복잡성으로 인한 어려움에도 불구하고, 본 연구는 감정 분석 발전에 두 가지 주요 기여를 합니다. 첫째, 감정 분석 및 반어 감지를 위해 태깅된 새로운 역사적 스페인어 데이터셋을 소개하고, 둘째, 역사적, 문화적 맥락을 핵심 특징으로 통합하여 LLMs 결과를 개선하는 데 인간 전문 지식이 중요한 반자동 주석 방법론을 제안합니다.

시사점, 한계점

시사점:
감정 분석 및 반어 감지를 위한 새로운 역사적 스페인어 데이터셋 구축.
LLMs 결과를 개선하는 데 인간 전문 지식이 중요한 반자동 주석 방법론 제안.
역사적, 문화적 맥락을 고려한 감정 분석 및 반어 감지 연구의 가능성 제시.
한계점:
데이터셋 개선 전략(감정 및 문맥적 단서 풍부화)이 역사적 언어 분석에 미치는 영향이 제한적임.
반어의 복잡성으로 인한 감정 분석 및 반어 감지의 어려움.
👍