본 논문은 대규모 언어 모델 기반의 음성 대화 시스템에서 사용자 발화 종료 감지(ETD)의 어려움을 해결하기 위해, 최초의 공개 ETD 데이터셋을 제시하고, 자원 제약 환경에서 실시간 ETD 성능을 향상시키는 새로운 협업 추론 프레임워크인 SpeculativeETD를 제안합니다. SpeculativeETD는 경량 GRU 기반 모델과 고성능 Wav2vec 기반 모델을 결합하여 실시간으로 비발화 단위를 빠르게 감지하고, 서버에서 더욱 정교한 발화 종료 여부 판단을 수행합니다. 실험 결과, SpeculativeETD는 계산량을 낮게 유지하면서 ETD 정확도를 크게 향상시킴을 보여줍니다. ETD 데이터셋은 텍스트 음성 변환 모델로 생성된 합성 음성 데이터와 웹에서 수집된 실제 음성 데이터로 구성됩니다.