Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Creative Preference Optimization

Created by
  • Haebom

저자

Mete Ismayilzada, Antonio Laverghetta Jr., Simone A. Luchini, Reet Patel, Antoine Bosselut, Lonneke van der Plas, Roger Beaty

개요

본 논문은 대규모 언어 모델(LLMs)의 창의적인 콘텐츠 생성 능력 향상을 위한 새로운 방법인 창의적 선호도 최적화(CrPO)를 제안합니다. 기존 방법들이 다양성이나 특정 작업에만 초점을 맞춘 것과 달리, CrPO는 참신성, 다양성, 놀라움, 품질 등 다차원적인 창의성을 모듈 방식으로 선호도 최적화 목표에 통합합니다. 20만 개 이상의 인간 생성 응답과 30가지 이상의 심리적 창의성 평가를 포함하는 대규모 인간 선호도 데이터셋 MuCE를 사용하여 여러 모델을 CrPO로 학습 및 평가한 결과, GPT-4o를 포함한 기존 모델들을 자동 및 인간 평가 모두에서 능가하는 것으로 나타났습니다. NoveltyBench를 이용한 추가 평가를 통해 접근 방식의 일반화 가능성을 확인하였으며, 결과적으로 선호도 프레임워크 내에서 창의성을 직접 최적화하는 것이 출력 품질을 저해하지 않고 LLMs의 창의적 능력을 향상시키는 유망한 방향임을 보여줍니다.

시사점, 한계점

시사점:
LLMs의 창의성 향상을 위해 다차원적 창의성을 고려한 새로운 방법(CrPO) 제시
대규모 인간 선호도 데이터셋 MuCE를 활용한 실험적 검증을 통해 성능 향상 확인
출력 품질 저하 없이 창의성을 향상시키는 접근 방식의 효용성 증명
NoveltyBench를 통한 접근 방식의 일반화 가능성 확인
한계점:
MuCE 데이터셋의 규모가 크지만, 다양한 종류의 창의성과 문화적 배경을 완벽하게 반영하지 못할 가능성 존재
CrPO의 일반화 가능성은 NoveltyBench에서 확인되었지만, 더 다양한 작업 및 데이터셋에 대한 추가적인 검증이 필요
인간의 창의성을 정확하게 정량화하는 데 한계가 존재하며, 이는 평가의 객관성에 영향을 미칠 수 있음
👍