본 논문은 모바일 기기에서 사용자 타이핑을 용이하게 하기 위해 대규모 언어 모델(LLM)에 오류 수정 기능을 적용하는 데 있어, LLM을 사용하여 고품질의 오류 수정 쌍 데이터셋을 합성하는 방법을 제시합니다. 기존 데이터 합성 파이프라인에 확장 가능하고 신뢰할 수 있는 추가 기능을 구축하기 위해 LLM에 오류 수정 도메인 지식을 프롬프트로 제공합니다. 합성 데이터 분포를 모바일 애플리케이션 도메인에 맞게 재가중치화 모델을 통해 조정하며, 이 모델은 프로덕션 환경에서 LLM을 배포할 때 실제 A/B 테스트 지표를 예측하여 학습됩니다. 마지막으로, 오류 수정에 대한 오프라인 평가와 프로덕션 라이브 A/B 테스트 모두에서 모델 성능을 향상시키기 위해 합성 데이터를 다른 데이터 소스와 혼합하는 모범 사례를 제시합니다.