Sign In

PromptPex: Automatic Test Generation for Language Model Prompts

Created by
  • Haebom
Category
Empty

저자

Reshabh K Sharma, Jonathan De Halleux, Shraddha Barke, Benjamin Zorn

개요

본 논문은 대규모 언어 모델(LLM) 프롬프트의 강건성을 확보하기 위한 새로운 접근법으로, LLM 기반의 프롬프트 단위 테스트 생성 및 평가 도구인 PromptPex를 제안한다. PromptPex는 프롬프트로부터 입력 및 출력 명세를 추출하여 다양하고, 목표 지향적이며, 유효한 단위 테스트를 생성한다. 생성된 테스트는 프롬프트 변경 시 회귀를 식별하고, 서로 다른 모델에 의한 프롬프트 해석 방식을 이해하는 데 도움을 준다. 실험 결과, PromptPex는 기존 LLM 기반 테스트 생성기보다 더 많은 무효 출력을 생성하는 테스트를 생성하며, 프롬프트 작성자가 프롬프트의 특정 측면을 명확하게 이해하고 테스트할 수 있도록 지원한다. PromptPex의 소스 코드는 깃허브에서 공개적으로 제공된다.

시사점, 한계점

시사점:
LLM 프롬프트의 강건성 확보를 위한 새로운 방법 제시
PromptPex를 통해 프롬프트의 회귀 감지 및 모델 간 해석 차이 이해 가능
프롬프트 작성자의 프롬프트 이해 및 테스트 용이성 증대
LLM 프롬프트 개발 과정의 효율성 향상
한계점:
PromptPex의 성능은 사용된 LLM 및 벤치마크 프롬프트에 의존적일 수 있음.
다양한 유형의 프롬프트 및 LLM에 대한 일반화 가능성에 대한 추가 연구 필요.
PromptPex가 생성한 테스트의 완벽한 커버리지를 보장하지 않을 수 있음.
복잡한 프롬프트에 대한 테스트 생성의 어려움.
👍