Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Tug-of-war between idioms' figurative and literal interpretations in LLMs

Created by
  • Haebom

저자

Soyoung Oh, Xinting Huang, Mathis Pink, Michael Hahn, Vera Demberg

개요

본 논문은 언어 모델이 비구성적인 비유적 해석을 가진 관용구를 어떻게 처리하는지 인과 추적을 통해 분석한다. 특히, 사전 훈련된 인과적 변환기가 관용구의 모호성을 처리하는 세 가지 메커니즘을 밝혀냈다: (i) 초기 하위 계층 및 특정 어텐션 헤드가 관용구의 비유적 해석을 검색하고 문자적 해석을 억제한다. (ii) 문맥이 관용구보다 먼저 나타나면, 모델은 가장 초기의 계층부터 이를 활용하고, 이후 계층에서 문맥이 검색된 해석과 충돌하는 경우 해석을 개선한다. (iii) 선택적이고 경쟁적인 경로를 통해 두 가지 해석을 모두 전달하는데, 중간 경로는 비유적 해석을 우선시하고 병렬 직접 경로는 문자적 해석을 선호하여 두 가지 해석이 모두 유지되도록 한다.

시사점, 한계점

시사점:
자율 회귀 변환기 내에서 관용구 이해에 대한 기계적 증거 제공
언어 모델이 관용구의 비유적 해석을 처리하는 구체적인 메커니즘 제시
관용구 처리 과정에서 초기 층의 역할과 문맥의 중요성 강조
한계점:
연구 결과가 특정 모델 아키텍처에 국한될 수 있음
다양한 관용구와 문맥에서의 일반화 가능성을 추가적으로 검증해야 함
모델의 정확한 이해 수준을 정량적으로 평가하는 지표의 부재
👍