Orion-Bix는 표 형식 데이터를 위한 파운데이션 모델로, 혼합된 숫자 및 범주형 필드, 약한 특징 구조, 제한된 레이블 데이터를 처리하는 데 어려움을 겪는 현실 세계의 머신 러닝 애플리케이션을 해결하기 위해 개발되었습니다. 이 모델은 양방향 어텐션과 메타 학습된 문맥 내 추론을 결합하여 소수 샷 표 형식 학습을 수행합니다. 표준, 그룹화된, 계층적 및 관계형 어텐션을 교대로 사용하며, multi-CLS 요약을 통해 로컬 및 글로벌 종속성을 효율적으로 캡처합니다. 레이블 인식 ICL 헤드는 즉시 적응하며, 계층적 의사 결정 라우팅을 통해 큰 레이블 공간으로 확장됩니다. 인과적 사전 지식을 사용하여 합성적으로 생성된 구조적으로 다양한 테이블에 대해 메타 학습되었으며, 이종 데이터 간에 전이 가능한 귀납적 편향을 학습합니다. scikit-learn 호환 파운데이션 모델로 제공되며, 그래디언트 부스팅 기준선을 능가하고 공개 벤치마크에서 최첨단 표 형식 파운데이션 모델과 경쟁하며, 양방향 어텐션과 에피소드 메타 학습이 강력하고 소수 샷 준비된 표 형식 학습을 가능하게 함을 보여줍니다.