챗지피티(GPT 포함)으로 높은 품질의 번역을 하기는 참 어렵습니다. 크게 네 가지 이유입니다.
1️⃣ 영어와 다른 목표언어의 Grammar와 Sentence Structure 2️⃣ 영어와 다른 목표언어의 Culture References 3️⃣ 영어가 아닌 다른 언어의 Lack of Data 4️⃣ 특정 분야의 용어, Technical Terms
번역관련 프롬프트를 개발하다가, 참고할 만한 논문을 몇 개 읽었습니다. 영어-> 한국어(혹은 한국어 ->) 로 번역할 때, 다음의 방법으로 번역 품질을 개선할 수 있었습니다.
1️⃣ Few-shot in Context Learning 정답에 가까운 예시를 주는 방식입니다. 이 때 Fuzzy matches의 방식은 품질의 일관성과 정확도를 높여줍니다. Fuzzy matches 는 task 와 유사한 컨텍스트를 활용하는 방식입니다. 예제를 프롬프트에 사용할 때는 5개 미만으로 주어야 품질에 영향을 미치는 것을 경험하였습니다.
2️⃣ Task Information Prompting 해결해야 하는 과제에 중점을 둔 상세한 프롬프트 작성 방식입니다. 프롬프트의 구조화와 상세한 내용을 '과제' 중심으로 세분화하는 것입니다.
3️⃣ Domain Specific Prompting 특정 도메인에 적합한 프롬프트를 제공하여 번역 성능을 향상 시키는 방법입니다. 도메인에 해당하는 단어를 선별하여 context 를 추가합니다.
위의 내용을 슬라이드에 정리하여 이미지로 첨부했습니다. 논문의 핵심 내용만을 발췌했습니다.
사이트를 구독하면 새 포스트 등 최신 업데이트를 알림과 메일로 가장 먼저 받아보실 수 있습니다.
Slashpage에 가입하고 'sujin-prompt-engineer'을 구독하세요!
구독
3
4
S
Samuel Yang
문득 폰에 뜬 박사님 슬래쉬 페이지 새 글 알림을 보다가 저도 모르게 눈이 동그래져서 얼른 들어와 봤습니다. "번역 프롬프트!" 이 번역 프롬프트가 제가 하는 일에서 정말 중요한 부분인데, 너무 나이브한 프롬프트 하나 만들어 놓고 사용하면서, 정작 프롬프트를 통해서 번역 품질을 높일 생각 자체를 안 하고 있었구나..라는 반성하는 마음이 밀려왔습니다. 나누어주신 통찰과 논문 추천 감사드립니다!
Sujin_Kang
박사님, 간만에 "알림" 보내봤습니다. 번역은 참 골치가 아픈 녀석이지요. 세 개의 논문들이 제가 요즘 하고 있는 번역 프롬프트의 퀄리티를 높여주었습니다. 그 중 마법의 문장을 하나 소개드립니다.
- Translate the given text in Korean. When translating, reflect the contextual meanings. Not Word-by-word translation.
- Translate the given text in Korean. When translating, reflect the contextual meanings. Not Word-by-word translation.
"Not" 이 포인트예요.