VoiceGRPO: Modern MoE Transformers with Group Relative Policy Optimization GRPO for AI Voice Health Care Applications on Voice Pathology Detection
Created by
Haebom
Category
Empty
저자
Enkhtogtokh Togootogtokh, Christian Klasen
개요
본 논문은 음성 병리 감지에 대한 음성 건강 관리 애플리케이션을 위해 그룹 상대 정책 최적화(GRPO)를 사용한 전문가 혼합 트랜스포머라는 새로운 AI 기술을 소개합니다. 건축상의 혁신을 통해, 모델의 안정성과 성능을 향상시키기 위해 근접 정책 최적화(PPO)와 그룹별 정규화된 정책 최적화(GRPO)라는 강화 학습에서 영감을 받은 고급 훈련 패러다임을 채택합니다. 합성적으로 생성된 음성 병리 데이터 세트에서 수행된 실험은 제안된 모델이 기존 방법에 비해 진단 정확도, F1 점수 및 ROC-AUC를 크게 향상시킨다는 것을 보여줍니다. 이러한 결과는 자동화된 음성 병리 감지를 발전시키고 궁극적으로 더 효과적인 의료 서비스 제공에 기여하기 위해 트랜스포머 아키텍처를 새로운 훈련 전략과 통합하는 잠재력을 강조합니다. 모델을 훈련하고 평가하는 데 사용된 코드는 https://github.com/enkhtogtokh/voicegrpo 에서 확인할 수 있습니다.