Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Data Therapist: Eliciting Domain Knowledge from Subject Matter Experts Using Large Language Models

Created by
  • Haebom

저자

Sungbok Shin, Hyeon Jeon, Sanghyun Hong, Niklas Elmqvist

개요

데이터 시각화는 기술적 전문성뿐 아니라 데이터의 도메인 특정 맥락에 대한 깊이 있는 이해를 필요로 합니다. 이러한 맥락에는 데이터 출처, 품질 및 의도된 용도에 대한 암묵적인 지식이 포함되는데, 이는 데이터 세트 자체에는 명시적으로 드러나지 않는 경우가 많습니다. 본 논문에서는 도메인 전문가가 반복적인 질의응답과 대화형 주석을 결합한 혼합 주도 프로세스를 통해 이러한 암묵적인 지식을 명시화하는 데 도움이 되는 웹 기반 도구인 Data Therapist를 제시합니다. 대규모 언어 모델을 기반으로 하는 이 시스템은 사용자가 제공한 데이터 세트를 분석하고, 사용자에게 표적 질문을 제시하며, 다양한 수준의 세분성으로 주석을 달 수 있도록 합니다. 결과적으로 생성된 구조화된 지식 기반은 사람과 자동화된 시각화 디자인 모두에 유용한 정보를 제공할 수 있습니다. 분자생물학, 회계, 정치학, 사용 가능한 보안 분야의 전문가 팀을 대상으로 한 질적 연구를 통해 도구를 평가했습니다. 연구 결과 전문가가 데이터에 대해 추론하는 방식에서 반복되는 패턴이 드러났으며, AI 지원이 시각화 디자인을 개선할 수 있는 영역이 강조되었습니다.

시사점, 한계점

시사점:
도메인 전문가의 암묵적 지식을 명시화하여 효과적인 데이터 시각화를 지원하는 새로운 웹 기반 도구(Data Therapist) 제시.
대규모 언어 모델을 활용하여 사용자에게 표적 질문을 제시하고 다양한 수준의 주석을 지원하는 효율적인 시스템 구축.
생성된 구조화된 지식 기반을 활용하여 사람과 자동화된 시각화 디자인 모두 향상 가능성 제시.
다양한 분야 전문가를 대상으로 한 질적 연구를 통해 도구의 유용성 및 AI 지원의 필요성 확인.
한계점:
질적 연구를 기반으로 한 평가이므로, 정량적인 성능 측정 및 일반화 가능성에 대한 추가 연구 필요.
특정 도메인에 국한된 연구 결과이므로, 다른 도메인으로의 일반화 가능성 검증 필요.
Data Therapist의 확장성 및 다양한 데이터 유형에 대한 적용 가능성에 대한 추가 연구 필요.
👍