Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Generative Prompt Internalization

Created by
  • Haebom
Category
Empty

저자

Haebin Shin, Lei Ji, Yeyun Gong, Sungdong Kim, Eunbi Choi, Minjoon Seo

개요

본 논문은 대규모 언어 모델 기반 애플리케이션에서 사용되는 고정적이고 긴 프롬프트로 인한 계산 비용 문제를 해결하기 위해 Generative Prompt Internalization (GenPI) 기법을 제안한다. GenPI는 결합 학습 방식을 사용하여 프롬프트 입력을 사용하는 모델의 동작을 복제할 뿐만 아니라, 모델의 동작이 변경되어야 하는 이유와 함께 프롬프트 내용 자체도 생성한다. 다양한 에이전트 기반 애플리케이션 시나리오에서 복잡한 프롬프트를 효과적으로 내재화함을 보여준다. 전용 환경과의 상호 작용 없이 효과적인 학습을 위해 에이전트와 환경의 역할을 바꿔 대화형 데이터셋을 자율적으로 수집하는 데이터 합성 기법을 도입한다. 이 기법은 상응하는 학습 데이터셋 없이 미리 정의된 프롬프트만 있는 시나리오에 특히 유용하다. 복잡한 프롬프트를 내재화함으로써 명시적인 프롬프트 없이도 고성능과 효율적인 추론을 가능하게 한다.

시사점, 한계점

시사점:
고정적이고 긴 프롬프트로 인한 계산 비용 문제 해결
프롬프트 내용 및 변경 이유 생성을 통한 모델 동작의 투명성 향상
에이전트 기반 애플리케이션에서의 효율적인 추론 가능
미리 정의된 프롬프트만 있는 경우에도 학습 가능
명시적인 프롬프트 없이 고성능 달성
한계점:
제안된 데이터 합성 기법의 일반화 성능에 대한 추가적인 검증 필요
다양한 애플리케이션 시나리오에 대한 범용성 평가 필요
제안된 방법의 실제 적용에 따른 성능 저하 가능성 분석 필요
데이터 합성 과정에서 발생할 수 있는 편향 문제에 대한 고려 필요
👍