Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

USDC: A Dataset of $\underline{U}$ser $\underline{S}$tance and $\underline{D}$ogmatism in Long $\underline{C}$onversations

Created by
  • Haebom

저자

Mounika Marreddy, Subba Reddy Oota, Venkata Charan Chinni, Manish Gupta, Lucie Flek

개요

본 논문은 Reddit의 긴 대화 스레드에서 사용자 의견 변화를 분석하는 데 초점을 맞추고 있습니다. 기존 연구들이 각 게시물을 독립적으로 취급하여 데이터셋을 구축한 것과 달리, 본 논문에서는 764개의 긴 다중 사용자 Reddit 대화 스레드에 대한 데이터셋 USDC를 구축합니다. USDC는 사용자의 입장(5점 척도)과 독단성(4점 척도)을 분류하기 위한 어노테이션을 포함합니다. 어노테이션 과정의 어려움을 해결하기 위해 Mistral Large와 GPT-4를 활용한 제로샷, 원샷, 퓨샷 어노테이션에 다수결 투표 방식을 적용하였으며, LLM 어노테이션과 인간 어노테이션 간 일관성을 확인했습니다. 마지막으로, USDC를 사용하여 LLaMA, Falcon, Vicuna와 같은 소형 언어 모델을 미세 조정하고 지시 조정하여 입장 및 독단성 분류 작업을 수행합니다. 데이터셋과 코드는 공개적으로 제공됩니다.

시사점, 한계점

시사점:
Reddit 대화 스레드에서 사용자 의견 변화를 분석하는 새로운 데이터셋 USDC를 제공합니다.
LLM을 활용한 효율적인 데이터 어노테이션 방법을 제시합니다.
다양한 소형 언어 모델을 활용하여 사용자 입장 및 독단성 분류를 수행할 수 있음을 보여줍니다.
개인화, 시장 조사, 정치 캠페인, 고객 서비스, 타겟 광고, 콘텐츠 조정 등 다양한 분야에 활용 가능성을 제시합니다.
한계점:
긴 대화 스레드로 인해 어노테이션 과정이 시간이 많이 소요되고 비용이 많이 들 수 있습니다.
사용자의 의견 변화가 미묘하게 나타나는 경우 어노테이션이 어려울 수 있습니다.
LLM 어노테이션에 대한 의존도가 높아 LLM의 성능에 따라 결과의 정확성이 영향을 받을 수 있습니다.
인간 어노테이터 간의 일치도(0.49~0.50)가 높지 않아 개선이 필요합니다.
👍