Meta4XNLI는 영어와 스페인어로 된 은유 감지 및 해석을 위해 새롭게 주석이 달린 최초의 병렬 자연어 추론(NLI) 데이터셋입니다. 이 데이터셋은 다국어 및 교차 언어 환경에서 은유적 언어를 감지하고 이해하는 데 있어 인코더 기반 모델과 디코더 기반 모델의 비교를 용이하게 합니다. 연구 결과, 미세 조정된 인코더가 디코더 전용 LLM보다 은유 감지에서 더 나은 성능을 보였으며, 은유 해석은 마스크 및 자기 회귀 모델의 성능이 비슷했지만, 추론이 은유적 언어의 영향을 받으면 성능이 현저히 저하되는 것으로 나타났습니다. 또한 번역이 언어 간 은유의 보존 또는 손실에 중요한 역할을 하고, 은유 발생 및 모델 성능에 영향을 미칠 수 있는 변화를 유발한다는 것을 발견했습니다. Meta4XNLI와 같은 자원은 언어 모델의 기능 분석과 언어 간 은유 처리에 대한 이해를 높이는 데 중요합니다. 이 데이터셋은 은유 해석, 교차 언어 은유 전달성, 그리고 다국어 주석 자원 개발에 대한 번역의 영향을 조사할 수 있는 기회를 제공합니다.