본 논문은 대규모 언어 모델(LLM)을 이용하여 생성된 합성 표본이 인간 설문조사의 효율적인 대안이 될 수 있는지, 특히 유럽 의회 선거 결과 예측에 적용 가능한지 여부를 조사합니다. 26,000명의 유럽 유권자 개인 정보를 사용하여 세 개의 LLM에 투표 행동 예측을 요청하고, 실제 결과와 비교 분석했습니다. 그 결과, LLM 기반 예측은 정확도가 낮고, 국가 및 언어적 맥락에 따라 정확도가 불균등하게 분포하며, 정확한 예측을 위해서는 자세한 태도 정보가 필요함을 보여줍니다. 따라서 LLM 합성 표본의 공공 여론 예측 적용 가능성은 제한적임을 시사합니다. 본 연구는 LLM의 편향성과 사회과학 분야 적용 시 발생할 수 있는 불평등 문제를 이해하고 완화하는 데 기여합니다.