Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

What Can String Probability Tell Us About Grammaticality?

Created by
  • Haebom
Category
Empty

저자

Jennifer Hu, Ethan Gotlieb Wilcox, Siyuan Song, Kyle Mahowald, Roger P. Levy

개요

언어 모델(LM)이 문법에 대해 무엇을 배웠는지에 대한 질문은 언어학 이론에 중요한 영향을 미치며, 여전히 뜨거운 논쟁의 대상이다. 본 논문은 문법, 의미, 문자열 확률 간의 관계에 대한 이론적 분석을 제시하며, 이를 통해 LM의 문법적 지식에 대한 통찰력을 얻고자 한다. 영어와 중국어의 28만 문장 쌍을 사용하여 세 가지 예측을 검증한다: (1) 최소 쌍 내 문자열 확률 간의 상관관계, (2) 모델과 인간의 최소 쌍 내 델타 간의 상관관계, (3) 짝을 이루지 않은 문법적 및 비문법적 문자열 간의 확률 공간 내 부실한 분리. 본 연구는 LM의 구조적 지식 학습에 확률을 사용하는 것에 대한 이론적 근거를 제공하며, LM 문법 평가의 향후 연구 방향을 제시한다.

시사점, 한계점

LM의 문법적 지식을 평가하기 위해 확률을 활용하는 새로운 이론적 프레임워크 제시
영어 및 중국어 데이터셋을 활용하여 프레임워크의 예측 검증
LM이 문법에 대해 학습한 내용에 대한 통찰력 제공
LM 문법 평가의 향후 연구 방향 제시
연구는 특정 언어 모델과 데이터셋에 한정될 수 있음
문법적 지식의 복잡성을 완전히 포착하지 못할 수 있음
의미론적 차이 외 다른 요인들이 결과에 영향을 미칠 수 있음
👍