Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

CLASH: Evaluating Language Models on Judging High-Stakes Dilemmas from Multiple Perspectives

Created by
  • Haebom

저자

Ayoung Lee, Ryan Sungmo Kwon, Peter Railton, Lu Wang

개요

본 논문은 고위험도 상황에서 상충하는 가치를 다루는 의사결정 능력을 평가하기 위한 새로운 데이터셋 CLASH를 제시합니다. CLASH는 345개의 고위험도 딜레마와 3,795개의 다양한 가치관을 가진 개인의 관점으로 구성되어 있으며, 기존 연구에서 다루지 못했던 가치 기반 의사결정 과정의 핵심 측면(결정의 모호함, 심리적 불편함, 가치관의 시간적 변화 등)을 연구할 수 있도록 설계되었습니다. 10개의 최첨단 언어 모델을 벤치마킹하여, 모델들이 명확한 상황에서는 높은 정확도를 보이지만, 모호한 상황에서는 50% 미만의 정확도를 보이는 등 가치관의 변화를 포함한 복잡한 가치에 대한 추론 능력이 부족함을 밝혔습니다. 또한, LLMs의 가치 선호도와 특정 가치로의 조종 가능성 간의 상관관계를 발견하고, 1인칭 관점보다 3인칭 관점에서의 가치 추론이 더 높은 조종 가능성을 보이는 것을 확인했습니다.

시사점, 한계점

시사점:
고위험도 상황에서의 가치 기반 의사결정에 대한 LLMs의 능력을 평가하는 새로운 데이터셋 CLASH를 제시.
LLMs가 모호한 상황에서의 의사결정 및 가치관의 변화를 포함한 복잡한 가치 추론에 어려움을 겪는다는 사실을 밝힘.
LLMs의 가치 선호도와 조종 가능성 간의 상관관계를 제시.
3인칭 관점이 1인칭 관점보다 LLMs의 조종 가능성을 높임을 밝힘.
한계점:
CLASH 데이터셋의 규모가 아직 제한적일 수 있음.
다양한 유형의 고위험도 딜레마를 더욱 포괄적으로 포함할 필요성.
LLMs의 가치 추론 능력 향상을 위한 구체적인 방법론 제시 부족.
👍