Sign In

Persuade Me if You Can: A Framework for Evaluating Persuasion Effectiveness and Susceptibility Among Large Language Models

Created by
  • Haebom
Category
Empty

저자

Nimet Beyza Bozdag, Shuhaib Mehri, Gokhan Tur, Dilek Hakkani-Tur

개요

본 논문은 대규모 언어 모델(LLM)의 설득력을 평가하기 위한 자동화된 프레임워크인 Persuade Me If You Can (PMIYC)를 제시합니다. PMIYC는 다중 에이전트 상호작용을 통해 설득 과정을 평가하며, 설득자 에이전트와 피설득자 에이전트 간의 다회차 대화를 분석하여 LLM의 설득 효과와 설득에 대한 취약성을 측정합니다. 다양한 LLM을 대상으로 주관적 맥락과 잘못된 정보 맥락 모두에서 평가를 수행하고, 인간 평가를 통해 프레임워크의 효과를 검증합니다. 실험 결과, Llama-3.3-70B와 GPT-4o는 유사한 설득 효과를 보이며 Claude 3 Haiku보다 30% 우수한 성능을 나타냈지만, 잘못된 정보에 대한 저항력은 GPT-4o가 Llama-3.3-70B보다 50% 이상 높았습니다.

시사점, 한계점

시사점:
LLM의 설득력과 설득에 대한 취약성을 정량적으로 비교 분석할 수 있는 새로운 프레임워크 PMIYC 제시.
다양한 LLM의 설득 능력과 잘못된 정보에 대한 저항력 차이를 실증적으로 밝힘. (Llama-3.3-70B와 GPT-4o 비교)
LLM의 윤리적 사용 및 안전한 AI 시스템 개발에 대한 중요한 시사점 제공.
인간 평가에 비해 확장성이 뛰어난 LLM 설득력 평가 방법 제시.
한계점:
PMIYC 프레임워크의 일반화 가능성에 대한 추가 연구 필요.
다양한 유형의 설득 전략 및 맥락에 대한 포괄적인 평가가 필요.
LLM의 설득력 저항력 평가에 대한 보다 정교한 지표 개발 필요.
👍