ConTextTab은 표 형태의 데이터에 대한 컨텍스트 학습(ICL) 모델입니다. 기존의 표 데이터 전용 ICL 모델들은 합성 데이터로 학습되어 실제 데이터의 풍부한 의미와 지식을 활용하는 데 제한이 있었고, 사전 훈련된 대규모 언어 모델 기반의 ICL 모델들은 컨텍스트 양의 제약이 있었습니다. ConTextTab은 표 데이터 전용 ICL 프레임워크에 의미 이해 및 정렬을 통합하여 이러한 문제를 해결합니다. 다양한 데이터 모드에 특화된 임베딩을 사용하고 대규모 실제 표 데이터로 학습하여 다양한 벤치마크에서 최첨단 성능을 달성하며, 특히 의미적으로 풍부한 CARTE 벤치마크에서 새로운 기준을 세웠습니다. GitHub에서 코드와 모델 체크포인트를 제공합니다.