본 논문은 지구 탄소 순환량 예측의 중요성을 강조하며, 데이터 기반 탄소 순환량 모델링(DDCFM) 분야의 발전을 위해 표준화된 데이터셋의 부재 문제를 해결하고자 CarbonSense 데이터셋을 제시합니다. CarbonSense는 전 세계 385개 지역의 측정된 탄소 순환량, 기상 예보 데이터, 위성 이미지를 통합한 머신러닝 친화적인 데이터셋으로, 견고한 모델 훈련을 가능하게 합니다. 또한, 최신 DDCFM 접근 방식을 사용한 기준 모델과 새로운 트랜스포머 기반 모델을 제공하여 다중 모달 심층 학습 기술의 잠재력을 보여줍니다. 이를 통해 심층 학습 연구자들의 진입 장벽을 낮추고 탄소 순환량 모델링 분야의 발전을 촉진하고자 합니다.