MelodySim은 표절 탐지를 위한 멜로디 인식 음악 유사성 모델 및 데이터셋을 제안합니다. 기존 MIDI 데이터셋인 Slakh2100을 확장하여 음표 분할, 아르페지오, 마이너 트랙 삭제(베이스 제외), 재악기화 등의 수정을 통해 각 곡의 변형을 생성함으로써 멜로디 유사성에 중점을 둔 데이터셋을 구축하는 새로운 방법을 제시합니다. 사용자 연구를 통해 긍정적 쌍이 실제로 유사한 멜로디를 포함하고 있고 다른 음악 트랙은 상당히 변경되었음을 확인했습니다. MERT 인코더를 사용하고 삼중항 신경망을 적용하여 멜로디 유사성을 포착하는 세그먼트 단위 멜로디 유사성 탐지 모델을 개발했습니다. 결과적인 의사결정 행렬은 표절이 발생할 수 있는 위치를 강조합니다. MelodySim 테스트 세트에서 높은 정확도를 달성했습니다.