Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Training Emergent Joint Associations: A Reinforcement Learning Approach to Creative Thinking in Language Models

Created by
  • Haebom
Category
Empty

저자

Mukul Singh, Ananya Singha, Aishni Parab, Pronita Mehrotra, Sumit Gulwani

개요

본 논문은 연상적 사고, 즉 언뜻 관련 없어 보이는 아이디어를 연결하는 능력이 인간 창의성과 문제 해결의 기본 요소임을 탐구한다. 연상적 사고 원리를 통해 강화 학습(RL)을 유도하여 이야기 쓰기, 코드 생성, 차트 생성 등 다양한 생성적 작업에서 모델의 성능을 향상시킬 수 있는지 연구한다. 창의성 연구에서 확립된 발산적 사고 지표를 통합하여 프롬프트 기반 평가 메커니즘을 사용하는 강화 학습 프레임워크를 소개한다. 이 프레임워크를 사용하여 기본 언어 모델을 미세 조정하여 개념적 연결성의 높은 정도를 통해 더 높은 참신성을 보여주는 출력을 보상한다. 실험 결과에 따르면 RL 기반 연상적 사고 훈련 모델은 더 독창적이고 일관된 이야기를 생성할 뿐만 아니라 프로그래밍 및 데이터 시각화와 같은 작업에서 향상된 추상화 및 유연성을 보인다.

시사점, 한계점

강화 학습을 통한 인지 창의성 원리 모델링을 통해 더 적응적이고 생성적인 AI를 만들 수 있다는 초기 증거 제시
이야기 쓰기, 코드 생성, 차트 생성 등 다양한 생성 작업에서 모델 성능 향상 가능성 확인
발산적 사고 지표를 활용한 프롬프트 기반 평가 메커니즘 제시
본 논문에서 제시된 연구 결과는 초기 단계이며, 추가 연구를 통해 개선 및 검증 필요
연상적 사고를 RL에 적용하는 구체적인 방법론에 대한 깊이 있는 설명 부족
모델의 일반화 능력에 대한 추가적인 실험 및 평가 필요
👍