Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Evaluating Local and Cloud-Based Large Language Models for Simulating Consumer Choices in Energy Stated Preference Surveys

Created by
  • Haebom
Category
Empty

저자

Han Wang, Jacek Pawlak, Aruna Sivakumar

개요

본 논문은 에너지 수요 연구에서 소비자 선호도를 파악하고 정책 결정에 정보를 제공하는 데 필수적인 설문 조사, 특히 진술 선호도(SP) 설문 조사에 대규모 언어 모델(LLM)을 활용하는 가능성을 조사한다. 기존 설문 조사 방법의 비용, 시간 소모, 편향 및 응답자 피로 문제를 해결하기 위해 LLM이 생성하는 인간과 유사한 텍스트 응답을 활용하는 것을 목표로 한다. 다양한 시나리오를 통해 개별 및 집계 수준에서 LLM의 시뮬레이션 성능을 평가하고, 프롬프트 요소, 문맥 내 학습(ICL), 사고 과정(CoT) 추론, 로컬 및 클라우드 기반 LLM 비교, 기존 선택 모델과의 통합, 잠재적 편향 등을 고려한다. LLM은 최대 48%의 정확도를 달성하여 무작위 추측을 능가하지만 실제 적용에는 부족함을 보였다. 로컬 및 클라우드 기반 LLM은 시뮬레이션 정확도는 유사하지만 프롬프트 준수 및 사회적 바람직성 편향에 대한 취약성은 다르게 나타났다. 이전 SP 선택이 가장 효과적인 입력 요소이며, 다양한 요소 형식을 포함하는 더 긴 프롬프트는 정확도를 낮출 수 있다는 것을 시사한다. 또한 기존의 혼합 로짓 선택 모델이 LLM보다 성능이 우수하며 LLM 프롬프트 개선에 대한 통찰력을 제공한다. LLM은 제한점이 있지만 기존 설문 조사 방법에 비해 확장성과 효율성이 높고 최소한의 과거 데이터만 필요하다. 향후 연구는 프롬프트 구조 개선, CoT 추론 추가 조사, 미세 조정 기법 탐색을 통해 LLM 기반 에너지 설문 조사 시뮬레이션을 개선해야 한다.

시사점, 한계점

시사점:
LLM을 활용한 에너지 수요 설문 조사 시뮬레이션의 가능성을 탐색하였다.
LLM이 기존 설문 조사 방법보다 확장성과 효율성이 높다는 것을 보여주었다.
프롬프트 디자인, ICL, CoT 추론 등 LLM 성능 향상을 위한 방향을 제시하였다.
기존 선택 모델과 LLM을 결합하여 시너지 효과를 창출할 수 있는 가능성을 제시하였다.
한계점:
LLM의 정확도(최대 48%)가 실제 적용에는 부족하다.
LLM이 사회적 바람직성 편향에 취약하다.
프롬프트의 길이와 형식이 LLM 성능에 영향을 미친다.
CoT 추론의 효과에 대한 추가 연구가 필요하다.
LLM의 미세 조정 기법에 대한 추가 연구가 필요하다.
👍