본 논문은 흐름 매칭(FM) 기반 텍스트 음성 변환(TTS) 모델의 성능 향상을 위한 새로운 기법인 얕은 흐름 매칭(SFM) 메커니즘을 제안합니다. SFM은 조잡한 출력 표현을 사용하여 FM 경로를 따라 중간 상태를 구성하고, 훈련 중 직교 투영 방법을 도입하여 이러한 상태의 시간적 위치를 적응적으로 결정하며, 단일 세그먼트 조각 흐름을 기반으로 원칙적인 구성 전략을 적용합니다. SFM 추론은 순수한 잡음이 아닌 중간 상태에서 시작하여 FM 경로의 후반 단계에 대한 계산에 집중합니다. 경량의 SFM 헤드를 사용하여 여러 TTS 모델에 SFM을 통합합니다. 실험 결과, SFM은 객관적 및 주관적 평가 모두에서 합성 음성의 자연스러움을 향상시키는 동시에 적응적 단계 ODE 솔버를 사용할 때 추론 시간을 크게 단축시키는 것으로 나타났습니다. 데모와 코드는 https://ydqmkkx.github.io/SFMDemo/ 에서 확인할 수 있습니다.