본 논문은 대규모 언어 모델(LLM)이 인간과 유사한 특성을 획득하도록 하는 새로운 인컨텍스트 학습 방법인 IROTE를 제안합니다. IROTE는 심리 이론을 바탕으로 프롬프트 내에 자기 성찰을 자동 생성하고 최적화하여 LLM의 특성 기반 행동을 유도합니다. 이 방법은 정보 이론적 목적 함수를 사용하여 LLM의 행동과 목표 특성 간의 연결성을 강화하고 불필요한 중복을 줄입니다. IROTE는 기존의 방법론보다 다양한 다운스트림 작업에서 더 안정적이고 일관된 특성 모방 성능을 보였습니다.
시사점, 한계점
•
시사점:
◦
LLM이 인간의 특성을 더 안정적으로 반영하도록 하는 새로운 인컨텍스트 학습 방법론 제시.