본 논문은 대규모 머신러닝 추론의 환경적 영향을 정량화하는 데 초점을 맞추고 있으며, 특히 저사양 하드웨어에서의 영향을 분석합니다. 다양한 하드웨어(CPU, GPU, 데이터센터 가속기)에서 고전적 모델과 현대적 모델 모두를 지원하는 교차 프레임워크 도구인 ML-EcoLyzer를 제시합니다. 이 도구는 적응형 모니터링과 하드웨어 인지 평가를 적용합니다. 또한, 탄소 배출량 1g당 처리되는 유효 파라미터 수를 정량화하는 환경 지속 가능성 점수(ESS)를 도입합니다. 1,900개 이상의 다양한 추론 구성을 평가하여, 양자화가 ESS를 향상시키고, 대형 가속기가 경량 애플리케이션에 비효율적일 수 있으며, 작은 모델도 최적화되지 않은 구현 시 상당한 비용이 발생할 수 있음을 보여줍니다. ML-EcoLyzer는 지속 가능한 모델 선택의 기준을 제시하고, 추론 중 환경적 비용에 대한 광범위한 실증적 평가를 제공합니다.