본 논문은 실제 로봇으로 피아노 연주를 학습하는 최초의 시스템을 제시합니다. 강화 학습을 이용한 시뮬레이션 기반 Sim2Real 접근 방식을 사용하여 정책을 학습하고, 실제 다관절 로봇에 적용했습니다. 시뮬레이션의 도메인 랜덤화와 역학 모델 정확도 간의 상호 작용을 철저히 평가하고, 복잡도가 다른 여러 곡을 통해 학습된 정책의 일반화 성능을 평가했습니다. 실제 환경에서 피아노 연주 학습의 개념 증명을 제공하며, 인간 수준의 조작을 위한 벤치마크로 피아노 연주를 채택할 것을 제안합니다. 코드는 오픈소스로 공개되었습니다 (https://lasr.org/research/learning-to-play-piano).