Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

OASST-ETC Dataset: Alignment Signals from Eye-tracking Analysis of LLM Responses

Created by
  • Haebom
Category
Empty

저자

Angela Lopez-Cardona, Sebastian Idesis, Miguel Barreda-Angeles, Sergi Abadal, Ioannis Arapakis

개요

본 논문은 대규모 언어 모델(LLM)의 인간 선호도 정렬 문제를 해결하기 위해, 독자의 눈 추적(ET) 데이터를 활용한 새로운 접근 방식을 제시합니다. OASST1 데이터셋의 LLM 생성 응답을 평가하면서 24명의 참가자를 대상으로 수집된 눈 추적 데이터(OASST-ETC)를 이용하여, 선호하는 응답과 선호하지 않는 응답 간의 독서 패턴 차이를 분석합니다. 합성 눈 추적 데이터와의 비교 분석을 통해, 인간의 독서 측정값과 다양한 트랜스포머 기반 모델의 주의 패턴 간의 상관관계를 조사하고, 선호하는 응답에서 더 강한 상관관계를 발견합니다. 이는 LLM 평가에서 인간의 인지 과정 연구를 위한 독특한 자료를 제공하며, 눈 추적 데이터를 정렬 방법에 통합하는 유망한 방향을 제시합니다. 데이터셋과 분석 코드는 공개적으로 제공됩니다.

시사점, 한계점

시사점:
LLM 평가에 눈 추적 데이터를 활용하여 인간 선호도와 LLM 출력 간의 상관관계를 규명하는 새로운 방법 제시.
선호하는 응답과 선호하지 않는 응답의 독서 패턴 차이를 구체적으로 분석하여 LLM 정렬 개선에 대한 통찰력 제공.
공개된 OASST-ETC 데이터셋은 향후 LLM 정렬 연구에 중요한 자원으로 활용될 수 있음.
트랜스포머 기반 모델의 주의 패턴과 인간의 독서 측정값 간의 상관관계 분석을 통해 모델 개선 방향 제시.
한계점:
현재 24명의 참가자로 구성된 데이터셋의 규모가 상대적으로 작아 일반화 가능성에 대한 추가 연구가 필요.
눈 추적 데이터 분석에 사용된 방법론의 한계 및 개선 가능성에 대한 논의 필요.
다양한 유형의 LLM과 다양한 유형의 과제에 대한 일반화 가능성 검증 필요.
👍