본 논문은 대규모 언어 모델(LLM) 기반 대화형 에이전트로부터 생성되는 방대한 대화 데이터를 활용하여 사회적 관심사, 트렌드, 집단적 우려 등을 분석하는 새로운 방법을 제시합니다. 기존 연구들이 개별 대화를 독립적으로 처리하는 것과 달리, 본 논문에서는 수천 건의 사용자-챗봇 상호작용을 종합적으로 분석하여 집단적 질문에 답하는 '집합적 질문 응답(Aggregative Question Answering)'이라는 새로운 과제를 제안합니다. 이를 위해 182,330건의 실제 챗봇 대화를 기반으로 6,027개의 집합적 질문으로 구성된 벤치마크 WildChat-AQA를 구축했습니다. 실험 결과, 기존 방법들은 효과적인 추론에 어려움을 겪거나 과도한 계산 비용이 발생하는 것으로 나타나, 대규모 대화 데이터에서 집단적 통찰력을 추출할 수 있는 새로운 접근 방식의 필요성을 강조합니다.