BERT-APC는 참조 피치 없이 보컬 녹음의 피치 오류를 수정하고 표현력과 자연스러움을 유지하는 새로운 자동 피치 보정(APC) 프레임워크입니다. BERT-APC는 고유한 고정 피치 예측기를 사용하여 음성에서 감지된 피치를 추정하고, 음악적 컨텍스트를 활용하기 위해 재구성된 음악 언어 모델을 활용하는 컨텍스트 인식 음표 피치 예측기를 사용합니다. 마지막으로, 음표 수준 보정 알고리즘은 감정 표현을 위한 의도적인 피치 편차를 유지하면서 피치 오류를 수정합니다. 또한, 현실적인 디튜닝 패턴을 시뮬레이션하여 음악 언어 모델의 견고성을 향상시키는 학습 가능한 데이터 증강 전략을 도입했습니다. BERT-APC는 두 개의 최신 음성 전사 모델보다 음표 피치 예측에서 우수한 성능을 보였고, 상업용 APC 도구보다 높은 MOS 점수를 기록했습니다.