본 논문은 텍스트-오디오 변환 확산 기반 생성 모델 7개의 추론 시 에너지 소비량을 분석합니다. 생성 파라미터 변화가 에너지 소비에 미치는 영향을 평가하고, 선택된 모든 모델에서 파레토 최적 해법을 고려하여 오디오 품질과 에너지 소비량 간의 최적 균형을 찾고자 합니다. 결과적으로 성능과 환경적 영향 간의 상충 관계에 대한 통찰력을 제공하여 보다 효율적인 생성 오디오 모델 개발에 기여합니다.
시사점, 한계점
•
시사점: 텍스트-오디오 생성 모델의 에너지 소비량에 대한 정량적 분석을 제공하여, 모델 개발 시 에너지 효율성을 고려하는 데 도움을 줍니다. 오디오 품질과 에너지 소비량 간의 최적 균형점을 찾는 데 대한 통찰력을 제공합니다. 더 효율적인 생성 오디오 모델 개발을 위한 방향을 제시합니다.
•
한계점: 분석 대상이 7개의 특정 모델로 제한되어 일반화에 어려움이 있을 수 있습니다. 에너지 소비량 측정 방법 및 환경 설정에 대한 자세한 설명이 부족할 수 있습니다. 다양한 하드웨어 플랫폼에서의 에너지 소비량 차이에 대한 고려가 부족할 수 있습니다.