TabArena는 테이블 형식 데이터를 위한 최초의 지속적으로 관리되는 살아있는 벤치마킹 시스템입니다. TabArena는 대표적인 데이터 세트 및 잘 구현된 모델을 수집하고, 대규모 벤치마킹 연구를 수행하여 공개 리더보드를 초기화하며, 숙련된 유지 관리 팀을 구성하여 시작되었습니다. 결과적으로, 검증 방법 및 하이퍼파라미터 구성의 앙상블이 모델을 최대한 활용하는 데 영향을 미친다는 것을 보여줍니다. 또한, 그래디언트 부스팅 트리가 여전히 강력하지만, 딥 러닝 방법이 더 큰 시간 예산과 앙상블 하에서 따라잡았으며, 파운데이션 모델은 작은 데이터 세트에서 뛰어납니다. 모델 간 앙상블은 테이블 형식 머신 러닝의 최첨단을 개선하지만, 검증 세트 과적합으로 인해 일부 딥 러닝 모델이 과도하게 대표되는 경향이 있음을 지적합니다. TabArena는 공개 리더보드, 재현 가능한 코드 및 유지 관리 프로토콜을 포함합니다.