# Location Not Found: Exposing Implicit Local and Global Biases in Multilingual LLMs

### 저자

Guy Mor-Lan, Omer Goldman, Matan Eyal, Adi Mayrav Gilady, Sivan Eiger, Idan Szpektor, Avinatan Hassidim, Yossi Matias, Reut Tsarfaty

### 💡 개요

본 연구는 다국어 대규모 언어 모델(LLM)이 언어 간 유창성 격차를 줄이는 과정에서 발생할 수 있는 암묵적인 지역적 및 전역적 편향을 정량화하는 것을 목표로 합니다. 이를 위해 12개 언어로 구성된 2,156개의 지역 정보 모호 질문으로 이루어진 테스트 세트인 LocQA를 제안합니다. LocQA를 통해 32개 모델을 평가한 결과, 미국 중심의 전역적 편향과 특정 언어 내에서 인구 규모가 큰 지역을 우선시하는 계층적 편향이 발견되었습니다.

### 🔑 시사점 및 한계

- 다국어 LLM은 언어 간 지식 및 규범 전파를 통해 예상치 못한 편향을 나타낼 수 있으며, 이는 LocQA와 같은 테스트 세트로 탐지할 수 있습니다.

- Instruction tuning은 특히 영어 외 언어에서 미국 중심의 전역적 편향을 악화시킬 수 있으며, 이는 모델 훈련 방식에 대한 고려가 필요함을 시사합니다.

- 모델은 동일 언어 내에서도 인구 규모에 따라 지역적 편향을 보이며, 이는 LLM의 지역적 행동을 형성하고 훈련 단계의 편향 영향을 정량화하는 데 중요한 통찰을 제공합니다.

- 현재 LocQA는 12개 언어에 초점을 맞추고 있으며, 더 넓은 범위의 언어와 지역에 대한 평가가 필요합니다.

[PDF 보기](https://arxiv.org/pdf/2604.19292)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
