모델명 GPT-4o mini | 특징 | 응답속도 | 품질 | 비용(v-크레딧) |
GPT-4.5 / GPT-4.1 | OpenAI 최신 고정밀 모델 | 중~느림 | 매우 높음 | 높음 |
GPT-4.1 mini / nano | 경량 고속 모델 | 빠름 | 중간 | 낮음 |
GPT-4o mini | 균형 잡힌 성능과 속도 | 빠름 | 중간 | 낮음 |
Claude 3.7 Sonnet | 정돈된 문장, 긴 응답에 강함 | 중간 | 높음 | 중간 |
Claude 3.5 Haiku | 짧고 정확한 응답, 빠른 속도 | 매우 빠름 | 중간 | 낮음 |
Gemini 2.5 Pro (Preview) | 최신 고성능 Google 모델 | 중간 | 높음 | 중간 |
Gemini 2.0 / 1.5 Flash | 빠른 응답 | 매우 빠름 | 중간 | 낮음 |
o1 / o1 mini / o3 mini (high/medium/low) | 초경량 실험 모델 | 매우 빠름 | 높음 | 중간~높음 |
항목 | 설명 | 권장값 |
Maximum Length | 한 번에 생성 가능한 최대 토큰 수 | 512~2048 |
Temperature | 창의성 조절 (높을수록 다양성↑, 정확도↓) | 0.2~0.7 |
Top P | 확률 누적 기반 단어 선택 범위 | 0.7~1.0 |
Frequency Penalty | 같은 단어 반복 억제 | 0.0~1.0 |
Presence Penalty | 같은 주제 반복 억제 | 0.0~1.0 |
Top K | 검색된 문서 조각 수 (RAG에서 사용됨) | 기본 3~4 |
이전 메시지 기억 | 대화 맥락 유지 여부 | 필요 시 활성화 (비용↑) |
변수명 | 설명 | 필수 여부 |
{query} | 사용자의 질문 원문 | ✅ 필수 |
{document_text} | 검색된 문서 조각 | ✅ 필수 |
{today} | 현재 날짜 (YYYY-MM-DD 형식) | 선택 |