Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

CLASH: Evaluating Language Models on Judging High-Stakes Dilemmas from Multiple Perspectives

Created by
  • Haebom

저자

Ayoung Lee, Ryan Sungmo Kwon, Peter Railton, Lu Wang

개요

본 논문은 고위험 상황에서 상충하는 가치를 다루는 어려움을 다루며, 특히 대규모 언어 모델(LLM)의 추론 능력 평가에 초점을 맞춥니다. 기존 연구가 일상적인 시나리오에 국한된 것과 달리, 본 연구는 고위험도 딜레마 345개와 다양한 가치관을 가진 3,795개의 개별 관점으로 구성된 CLASH(Character perspective-based LLM Assessments in Situations with High-stakes) 데이터셋을 소개합니다. CLASH는 가치 기반 의사결정 과정의 중요한 측면(의사결정의 모호함, 심리적 불편함, 가치관의 시간적 변화)을 연구할 수 있도록 설계되었습니다. 10개의 최첨단 모델을 벤치마킹한 결과, (1) GPT-4o 및 Claude-Sonnet과 같은 최고 성능 모델조차도 모호한 결정 상황을 식별하는 정확도가 50% 미만이었고 명확한 시나리오에서는 성능이 훨씬 더 좋았습니다. (2) LLM은 인간이 표시한 심리적 불편함을 합리적으로 예측하지만, 가치 변화를 포함하는 관점을 제대로 이해하지 못하여 복잡한 가치에 대한 추론 능력이 부족함을 보여줍니다. (3) LLM의 가치 선호도와 특정 가치에 대한 조종 가능성 간에 상관관계가 있음을 밝혔습니다. (4) LLM은 1인칭 관점보다 3인칭 관점에서 가치 추론에 참여할 때 조종 가능성이 더 높았지만, 특정 가치 쌍은 1인칭 프레임에서만 유일하게 이점을 얻었습니다.

시사점, 한계점

시사점:
고위험도 상황에서의 LLM의 가치 기반 의사결정 능력 평가를 위한 새로운 데이터셋(CLASH) 제시
LLM의 가치 추론 능력의 한계, 특히 모호한 상황과 가치 변화에 대한 이해 부족을 밝힘
LLM의 가치 선호도와 조종 가능성 간의 상관관계 발견
1인칭 및 3인칭 관점에서의 가치 추론 성능 비교 분석을 통한 LLM의 강점과 약점 파악
한계점:
CLASH 데이터셋의 규모 및 다양성에 대한 추가적인 연구 필요
LLM의 가치 추론 능력 향상을 위한 구체적인 방법론 제시 부족
특정 가치 쌍에 대한 1인칭 프레임의 유일한 이점에 대한 추가적인 분석 필요
실제 고위험도 상황에서의 LLM 적용에 대한 검증 부족
👍
You do not have permission to write comments