Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

An Investigation into Value Misalignment in LLM-Generated Texts for Cultural Heritage

Created by
  • Haebom

저자

Fan Bu, Zheng Wang, Siyi Wang, Ziyao Liu

개요

본 논문은 문화유산 관련 작업(기념물 설명 생성, 고대 텍스트 번역, 구전 전통 보존, 교육 콘텐츠 생성 등)에서 점점 더 많이 사용되는 대규모 언어 모델(LLM)의 문화적 가치 정렬 문제를 체계적으로 평가한다. 5개의 오픈소스 LLM을 대상으로 문화유산 지식 체계 내 5개 범주, 17가지 측면을 포괄하는 1066개의 질의 작업을 수행하여 생성된 텍스트에서 문화적 가치 불일치의 유형과 비율을 조사한다. 자동 및 수동 접근 방식을 사용하여 LLM이 생성한 텍스트의 문화적 가치 불일치를 효과적으로 감지하고 분석하며, 그 결과 65% 이상의 생성된 텍스트에서 상당한 문화적 불일치가 나타났음을 밝혀냈다. 본 논문은 이러한 결과 외에도 향후 LLM의 문화적 민감성과 신뢰성 향상을 위한 연구에 귀중한 자료가 될 수 있는 벤치마크 데이터셋과 포괄적인 평가 워크플로우를 제시한다.

시사점, 한계점

시사점:
LLM이 문화유산 관련 작업에서 문화적 가치 불일치를 야기할 수 있음을 체계적으로 규명하였다.
문화유산 분야에서 LLM의 신뢰성 평가를 위한 벤치마크 데이터셋과 평가 워크플로우를 제공하였다.
LLM의 문화적 민감성 향상을 위한 후속 연구의 방향을 제시하였다.
한계점:
평가에 사용된 LLM의 종류와 수가 제한적일 수 있다.
문화적 가치 불일치의 정의 및 측정 방식에 대한 주관성이 존재할 수 있다.
다양한 문화적 맥락과 언어에 대한 고려가 부족할 수 있다.
👍