2DNMRGym은 기계학습 기반 2D NMR 분석을 위한 최초의 주석이 달린 실험 데이터셋입니다. 22,000개 이상의 HSQC 스펙트럼과 해당 분자 그래프 및 SMILES 문자열을 포함하고 있으며, 기존 검증된 방법으로 생성된 주석을 사용한 대리 감독 설정을 채택하여 모델의 일반화 능력을 엄격하게 평가합니다. 2D 및 3D GNN 및 GNN 트랜스포머 모델을 사용한 벤치마크 결과를 제공하며, NMR 유도 구조 작업에서 원자 수준 분자 표현을 평가하기 위한 화학적으로 의미 있는 벤치마크를 제시합니다. 데이터와 코드는 Huggingface와 Github에서 공개적으로 이용 가능합니다.