본 논문은 연상적 사고, 즉 언뜻 관련 없어 보이는 아이디어를 연결하는 능력이 인간 창의성과 문제 해결의 기본 요소임을 탐구한다. 연상적 사고 원리를 통해 강화 학습(RL)을 유도하여 이야기 쓰기, 코드 생성, 차트 생성 등 다양한 생성적 작업에서 모델의 성능을 향상시킬 수 있는지 연구한다. 창의성 연구에서 확립된 발산적 사고 지표를 통합하여 프롬프트 기반 평가 메커니즘을 사용하는 강화 학습 프레임워크를 소개한다. 이 프레임워크를 사용하여 기본 언어 모델을 미세 조정하여 개념적 연결성의 높은 정도를 통해 더 높은 참신성을 보여주는 출력을 보상한다. 실험 결과에 따르면 RL 기반 연상적 사고 훈련 모델은 더 독창적이고 일관된 이야기를 생성할 뿐만 아니라 프로그래밍 및 데이터 시각화와 같은 작업에서 향상된 추상화 및 유연성을 보인다.