Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Meaning Is Not A Metric: Using LLMs to make cultural context legible at scale

Created by
  • Haebom

저자

Cody Kommers, Drew Hemment, Maria Antoniak, Joel Z. Leibo, Hoyt Long, Emily Robinson, Adam Sobey

개요

본 논문은 대규모 언어 모델(LLM)이 AI 기반 사회기술 시스템에서 전례 없는 규모로 문화적 맥락, 그리고 따라서 인간의 의미를 명확하게 해줄 수 있다고 주장합니다. 기존 시스템은 표준화를 강요하는 숫자적 표현인 얇은 기술(thin description)에 의존하여 인간 활동의 의미를 부여하는 문화적 맥락을 제거했기 때문에 인간의 의미를 나타낼 수 없었습니다. 반면, 인문학 및 질적 사회과학 학자들은 이질성을 수용하고 인간의 의미를 나타내는 데 필요한 맥락 정보를 유지하는 구두 표현인 두꺼운 기술(thick description)을 통해 의미를 나타내는 프레임워크를 개발했습니다. 이러한 방법은 의미를 효과적으로 암호화할 수 있지만, 대규모로 배포하기는 어렵습니다. 그러나 LLM의 언어 능력은 이제 두꺼운 기술의 생성 및 처리를 (적어도 부분적으로) 자동화하는 수단을 제공하여 이러한 병목 현상을 극복할 수 있습니다. 인간의 의미를 명확하게 만드는 문제는 단순히 더 나은 지표를 선택하는 것이 아니라 (두꺼운 기술에 기반한) 새로운 표현 형식을 개발하는 것에 관한 것이라고 주장합니다. 생성형 AI 적용의 중요한 방향으로 제시하며, 맥락 보존, 해석적 다원주의 유지, 살아온 경험과 비판적 거리에 기반한 관점 통합, 질적 내용과 양적 규모 구분, 의미를 정적인 것이 아닌 동적인 것으로 인정하는 다섯 가지 주요 과제를 확인합니다. 또한, 두꺼운 기술은 LLM에서 문화를 나타내는 것(또는 사용하는 것)의 어려움에 대한 여러 가지 새롭게 등장하는 우려를 해결하는 통합 프레임워크 역할을 할 수 있다고 제안합니다.

시사점, 한계점

시사점:
LLM이 문화적 맥락을 고려하여 인간 의미를 대규모로 해석 가능하게 할 수 있는 잠재력 제시.
두꺼운 기술을 활용한 새로운 표현 방식이 인간 의미를 더욱 정확하게 표현하는 데 기여할 수 있음.
생성형 AI의 응용 분야에 대한 새로운 방향 제시.
LLM의 문화적 표현 관련 문제 해결을 위한 통합 프레임워크 제안.
한계점:
맥락 보존, 해석적 다원주의 유지, 경험과 비판적 거리 통합, 질적/양적 내용 구분, 동적인 의미 인정 등의 과제 해결에 대한 구체적인 방법 제시 부족.
두꺼운 기술의 자동화가 완벽하지 않을 가능성과 그에 따른 오류 발생 가능성에 대한 논의 부족.
LLM의 편향성 및 윤리적 문제에 대한 충분한 고려가 부족.
실증적인 연구 결과가 아닌 개념적인 논의에 그침.
👍