Jingwen Cheng, Kshitish Ghate, Wenyue Hua, William Yang Wang, Hong Shen, Fei Fang
개요
본 논문은 Reddit과 뉴스 기사에서 수집한 94,000개 이상의 LLM(대규모 언어 모델) 사용 사례를 포함하는 REALM 데이터셋을 소개합니다. REALM은 LLM의 다양한 응용 분야와 사용자 인구 통계라는 두 가지 주요 측면을 포착하여 LLM 응용 프로그램을 분류하고 사용자 직업이 사용하는 응용 프로그램 유형과 어떻게 관련되는지 탐구합니다. 실제 데이터를 통합함으로써 REALM은 다양한 영역에서 LLM 채택에 대한 통찰력을 제공하고 진화하는 사회적 역할에 대한 향후 연구의 기초를 마련합니다. 데이터는 전용 대시보드(https://realm-e7682.web.app/)에서 확인할 수 있습니다.