한국어로 프롬프트를 작성하는 방법 - sujin-prompt-engineer한국어로 프롬프트를 작성하는 방법 한국어는 맥락에 크게 의존하는 ‘고맥락 언어’입니다. LLM에 그대로 입력하면 종종 의도가 왜곡되거나 핵심이 누락됩니다. 저는 영어로 프롬프트를 작성하지만, 한국어만 해야하는 모델을 사용할 때는 다음과 같은 방법을 사용합니다. 1️⃣ 형태소 단위로 “의미 덩어리” 고정하기 고유한 의미 덩어리를 명확히 구분해야, 모델이 어절 간 경계를 놓치지 않습니다. 한국어는 한 어절 안에 조사, 어미, 접두사 접미사등이 붙어 있을 수 있어요. LLM이 input의 경계를 구분하는 과정에서 잘못 분리하게 되면 의미를 왜곡하기도 합니다. 그 결과 할루시네이션이나, 잘못된 답변을 생성합니다. ✅ 의미 덩어리(semantic chunk)란? 문장을 이루는 최소 의미 단위, 핵심 명사, 동사, 형용사 같은 틀을 말해요. ✅ 왜 고정해야 할까? LLM은 입력 텍스트를 내부적으로 토큰(token) 단위로 분해한 뒤 확률적으로 처리합니다. 의미 덩어리를 띄어쓰기나 강조 표시(…, 《…》)하면, 모델이 그 단어 그룹을 하나의 토큰 묶음으로 인식할 가능성이 높아집니다. 🔥 프롬프트에 적용하는 방법 ✔️ 꼭 띄어쓰기 하기: 모든 조사, 어미 앞뒤로 띄어 쓰기 ✔️ 주격 조사(은/는, 이/가), 목적격 조사(을/를) 꼭 써주기 ✔️ 핵심 어간 강조: 중요한 키워드를 굵게 혹은 << >>로 감싸 의미 경계를 표시하기 ✔️ 토큰 분할 도구 활용: KoNLPy 같은 형태소 분석기로 사전 테스트해 보세요. 모델이 한국어 문장을 어떻게 분해하는지 확인 후 프롬프트 결과를 고도화하기도 해요. 2️⃣ 한국어 특화 어말어미·어투 제어 ✔️ 어말어미 일관성 유지하기 ✔️ 존댓말(–습니다) vs 반말(–해요) 중 하나 선택. Deferential form '-습니다'를 사용하면 openAI 모델은 답을 더 길고 상세하게 합니다. ⭕ 두 가지 방법의 프롬프트 기대 결과 모델이 핵심 정보(명사구·동사구 등 의미 단위)를 정확히 파악해, 출력의 일관성과 정확도를 크게 향상 시킬 수 있어요. 숫자·단위·고유명사처럼 분리 오류가 치명적인 부분에서 실수를 줄여 줍니다. 한국어로 프롬프트를 작성할 때는, 한국어의 고맥락적 특수성을 온전히 반영해야 결과가 개선되기 때문에, 섬세함을 기울여야 합니다.
재현 되는 사이트와 알림 대상 콘텐츠를 알려주시면 자세히 확인해서 문제 해결을 도와드리겠습니다!